- Katılım
- 24 Şubat 2018
- Mesajlar
- 26,702
Günümüzde "yapay zeka" olarak geçen hizmetlerin tamamı, "Larga Language Model" denen sistemler. LLM'ler esasında hiçbir şey bilmez. İnternette taradıkları bilgi kaynaklarından topladıkları sinirsel ağ parametrelerini kullanarak cümle kurarlar ve bu cümleler de, hepimizin tecrübe ettiği üzere, çoğunlukla anlamlı ve yararlı olur.
Benim burada dikkat çekmek istediğim konu şu: LLM'lerin kaliteli sonuç üretmesi için devasa bir veri havuzuna ihtiyaçları vardır. Bu veri havuzu da internetin kendisidir. Daha ayrıntıya girersek, öncelikle internetteki bilgi paylaşım ortamları (forumlar, stackoverflow, quora, reddit, bloglar vs), sonrasında da faydalı bilgilerin bulunduğu makalelerin yer aldığı siteler, sonrasında da internetteki geriye kalan "çöp".
Bu durumuda eğer herkes internetteki bilgi paylasım sitelerini bırakır ve sadece yapay zeka kullanırsa, o zaman yapay zekanın bilgi havuzu artık statik hale gelir. Yeni bilgileri öğrenemez. Artık sorulan soruların tamamı eski bilgi kaynaklarına göre cevaplanır. Zaten böyle bir ihtimal öngörüldüğü için LLM firmaları sürekli olarak eleman arıyorlar kendi LLM'lerini manuel olarak train etmek için. Ama bu manuel train, hiçbir zaman internetteki bilgi paylaşım sitelerindeki organik veri zenginliğini sağlayamaz.
O yüzden herkesin internet bilgi paylaşım sitelerine sahip çıkması lazım. LLM öncesi bilgi araştırma kültürümüzün ve yeteneğimizin de körelmesine izin vermememiz lazım.
Benim burada dikkat çekmek istediğim konu şu: LLM'lerin kaliteli sonuç üretmesi için devasa bir veri havuzuna ihtiyaçları vardır. Bu veri havuzu da internetin kendisidir. Daha ayrıntıya girersek, öncelikle internetteki bilgi paylaşım ortamları (forumlar, stackoverflow, quora, reddit, bloglar vs), sonrasında da faydalı bilgilerin bulunduğu makalelerin yer aldığı siteler, sonrasında da internetteki geriye kalan "çöp".
Bu durumuda eğer herkes internetteki bilgi paylasım sitelerini bırakır ve sadece yapay zeka kullanırsa, o zaman yapay zekanın bilgi havuzu artık statik hale gelir. Yeni bilgileri öğrenemez. Artık sorulan soruların tamamı eski bilgi kaynaklarına göre cevaplanır. Zaten böyle bir ihtimal öngörüldüğü için LLM firmaları sürekli olarak eleman arıyorlar kendi LLM'lerini manuel olarak train etmek için. Ama bu manuel train, hiçbir zaman internetteki bilgi paylaşım sitelerindeki organik veri zenginliğini sağlayamaz.
O yüzden herkesin internet bilgi paylaşım sitelerine sahip çıkması lazım. LLM öncesi bilgi araştırma kültürümüzün ve yeteneğimizin de körelmesine izin vermememiz lazım.
