fide
Meraklı ve "nasıl" sorusunu seven biri
- Katılım
- 8 Eylül 2021
- Mesajlar
- 2,005
ChatGPT, yapay zeka alanında hayret verici yeniliklerle hayatımıza girdi. Son olarak ChatGPT-4o modeli ile hem ses hem de görüntü işleme (duygu durum tespiti yada matematik problemi çözerken yardımcı olam gibi) ileri düzey özellikler kazandı. Bunlar Youtube vb sosyal mecralarda yeterince konuşuldu diye düşünüyorum.
Burada merak ettiğim şey ise ChatGPT'nin bize nasıl hizmet edebileceği. Bu konuda ilk başta çok fazla seçenek var gibi görünse de bir noktadan sonra programlamaya sarınca iş değişiyor.
Mesela bir kamerayı ChatGPT'nin gören gözü haline getirip bana gördüğü nesneleri saymasını nasıl sağlayabilirim?
Yada başka bir soru chatGPT'nin masanın üstünde gördüğü nesnelerin yaklaşık konumlarını (önde/arkada/sağda/solda/sağ köşeye yakın gibi) vermesini nasıl sağlayabilirim.
Burda kamerayı açıp "hey ChatGPT, bana gödüğün nesnelerin konumlarını söyle" demek yerine bunu elektronik ortamda nasıl verip cevapları bilgisayardan alabilirim kısmını soruyorum.
Yada etraftaki sesleri yazıya çevirip metin halinde almak istesem nasıl bir yol izlemeliyim?
ChatGPT tarafından geliştirilen openai isimli bir python api var. Dün biraz üzerinde çalıştım. Önce versiyon problemleri ile karşılaştım sonra da account/ödeme problemleri ile. Anladğım kadarıyla deneme sürümü chatGPT kullanımı ücretsiz iken kod/API kısmı tamamen ücretli .Bu da aşılmayacak bir pürüz değil ama asıl görme ve işitme gibi metin tabanlı olmayan işlemlerin chatGPT ile nasıl yapılabileceğini merak ediyorum. Tahminim var ama net bir bilgim yok. OpenCV ile görüntü işleme yapılırken kamera adresi veriliyor ve openCV üzerinde belirlediği nesneleri işaretmelesi yada konum vermesi isteniyor. Bu da benzer bir şekilde olacaktır diye tahmşn ediyorum.
Bu konuda sizlerin düşünceleri yada deneyimleri nelerdir? Yapay zeka olayında asıl vurucu hamlenin telefondaki bir sesten ziyade bunu harekete/aksiyona dönüştürebilecek bir donanıma bürünmüş haliyle olacağını düşünüyorum.
Burada merak ettiğim şey ise ChatGPT'nin bize nasıl hizmet edebileceği. Bu konuda ilk başta çok fazla seçenek var gibi görünse de bir noktadan sonra programlamaya sarınca iş değişiyor.
Mesela bir kamerayı ChatGPT'nin gören gözü haline getirip bana gördüğü nesneleri saymasını nasıl sağlayabilirim?
Yada başka bir soru chatGPT'nin masanın üstünde gördüğü nesnelerin yaklaşık konumlarını (önde/arkada/sağda/solda/sağ köşeye yakın gibi) vermesini nasıl sağlayabilirim.
Burda kamerayı açıp "hey ChatGPT, bana gödüğün nesnelerin konumlarını söyle" demek yerine bunu elektronik ortamda nasıl verip cevapları bilgisayardan alabilirim kısmını soruyorum.
Yada etraftaki sesleri yazıya çevirip metin halinde almak istesem nasıl bir yol izlemeliyim?
ChatGPT tarafından geliştirilen openai isimli bir python api var. Dün biraz üzerinde çalıştım. Önce versiyon problemleri ile karşılaştım sonra da account/ödeme problemleri ile. Anladğım kadarıyla deneme sürümü chatGPT kullanımı ücretsiz iken kod/API kısmı tamamen ücretli .Bu da aşılmayacak bir pürüz değil ama asıl görme ve işitme gibi metin tabanlı olmayan işlemlerin chatGPT ile nasıl yapılabileceğini merak ediyorum. Tahminim var ama net bir bilgim yok. OpenCV ile görüntü işleme yapılırken kamera adresi veriliyor ve openCV üzerinde belirlediği nesneleri işaretmelesi yada konum vermesi isteniyor. Bu da benzer bir şekilde olacaktır diye tahmşn ediyorum.
Bu konuda sizlerin düşünceleri yada deneyimleri nelerdir? Yapay zeka olayında asıl vurucu hamlenin telefondaki bir sesten ziyade bunu harekete/aksiyona dönüştürebilecek bir donanıma bürünmüş haliyle olacağını düşünüyorum.