Veri İşleme: Örnek Dosya Üzerinden Adımlı Anlatım

nt

Emekli
Katılım
21 Nisan 2023
Mesajlar
1,221
Selam !

Bugün kullanarak Excel dosyalarında veri işleme konusunu anlatmak istiyorum. Aşağıda, adım adım bir rehberle nasıl yapılacağını bulabilirsiniz.
linux kullanıyorum örneklerimi linux içindir (exel programını bilmiyorum ctrl+n dışında onun için bu işlemleri python ile yapıyorum)

Eğer Linux kullanıcısı iseniz, verdiğim örnekler direkt olarak Linux ortamında çalışacak şekilde düzenlenmiştir. Ayrıca, Python kodlarını terminale yazdığınızda çalıştırabilir ve sonuçları gözlemleyebilirsiniz.

örnek 4 veri var ama bu gerçek dünyada 140000 yada 14.000000 olabilir exelde yada .csv ile uğraşırken bu kodlar çok işinize yarıyacak

Örnek exel dosyası içeriği
| Ad | Yas | Maaş |

| Ahmet | 25 | 5000 |
| Mehmet | 30 | 6000 |
| Ayşe | 28 | 5500 |
| Fatma | 35 | 7000 |

Pandas Kütüphanesini kurun
terminale:
pip install pandas

Excel Dosyasından Veriyi Okuma filtreleme ve kayıt
örnek python kodumuz:
import pandas as pd

dosya_yolu = 'ornek_veri.xlsx'
df = pd.read_excel(dosya_yolu)
print("Başlangıç Verisi:")
print(df)
secilen_veri = df[df['Maaş'] > 5000] #maaşı 5000den fazla olanları ayırmak için
print("\nMaaşı 5000'den Büyük Olanlar:")
print(secilen_veri)
kayit_yolu = 'islenmis_veri.xlsx'
secilen_veri.to_excel(kayit_yolu, index=False)

kodu çalıştırdıgınızda kod verileri içe aktarır (ornek_veri.xlsx) gerekli filtreleri kullanır ben "> 5000 kullandım" ve istediğiniz veriyi başka bir yere (islenmis_veri.xlsx) kaydeder
bunu yaşı adı gibi değişşik şekillerde filtrreliye biliriz

kodumuzun terminal çıktısı:
Başlangıç Verisi:
      Ad  Yas  Maaş
0  Ahmet   25  5000
1 Mehmet   30  6000
2   Ayşe   28  5500
3  Fatma   35  7000

Maaşı 5000'den Büyük Olanlar:
      Ad  Yas  Maaş
1 Mehmet   30  6000
2   Ayşe   28  5500
3  Fatma   35  7000

ahmetin 5001 olsa idi oda listeye girerdi kodu ve çalışma mantığı basittir aklınıza takılanları sormakdan çekinmeyin
 
Son düzenleme:
ahmetin 5001 olsa idi oda listeye girerdi kodu ve çalışma mantığı basittir aklınıza takılanları sormakdan çekinmeyin
Peki soruyorum 10bin(Yazı ile onbin) adet kaydımız olsa idi .10 000 adet ismi ,yaşı ve maaşını kod satırında yazmak zorundamıydık?
Bunu excelden import etmiyormu?
Hadi edebiliyorsa neden excelden import ediyoruz bunu excelin göstermesi 5 saniye sürmez
 
Peki soruyorum 10bin(Yazı ile onbin) adet kaydımız olsa idi .10 000 adet ismi ,yaşı ve maaşını kod satırında yazmak zorundamıydık?
Bunu excelden import etmiyormu?
Hadi edebiliyorsa neden excelden import ediyoruz bunu excelin gstermesi 5 saniye sürmez
atıyorum bir siteden laptop fiyatlarını çektiniz web kazıma ile
marka model özellik fiyat sutunlarınız var hazır exel ıcınde ve 1milyon satır var hepsi dolu
bunları fiyatlarına göre yeni bir exele kayır edebılır boş satırları bulabilir eminim exeldede vardır bunu yapmanın bır yolu sizin exel konusundaki uzmanlığınıza hayranım geçen gokannın gonderısıne yaptıgınız tabloyu ınceledim fakat bir program ıcınde kullanmak ıcın bu şekilde yapmak hem zaman hem güç kazandırır
 
Yaw estağurullah .Benim demek istediğim bir program bir yerde kullanılıyorsa avantajı olduğundan kullanılmalı ,zaman kazandırdığı için falan demek istedim
Excelde filtreleme ne kadar gelişmiş olduğunu göstermek için mesela şu kısa videoyu örnek vereyim

 
  • Beğen
Reactions: nt
@Omega abi bir program tasarladık diyelim 5000tl altındaki bilgisayarları 3 4 farklı siteden çekerek tek tıkla listesini görmek için
ve bu program içinde kullanılabilir yani yoksa çok bir işimize yaramaz

nerede kullanıcagınız sizin hayal gücünüze bağlı (yapayzeka veri girişi olabilir, borsa coin falan verileri ile olabilir örnekler çok)
 
CSV ile devam ...

CSV, "Comma-Separated Values"ın kısaltmasıdır ve bir tür metin dosyasıdır.

CSV dosyaları, verileri düzenli bir şekilde depolamanın ve paylaşmanın basit bir yoludur.
İşte neden önemli oldukları ve projelerde nasıl kullanılabileklerını anlatıcagım

Neden Önemli?
Kolay Okunabilirlik ve Yazılabilirlik:
CSV dosyaları insanlar tarafından okunması ve yazılması kolaydır. Verileri anlamak ve düzenlemek daha basit hale gelir.
Evrenselliği: CSV, birçok program ve uygulama tarafından desteklenen bir formattır. Bu da verilerinizi farklı araçlar arasında kolayca taşımanıza olanak tanır.
EN ÖNEMLİSİ Hafif ve Basit: Dosya yapısı hafif ve basittir, bu da dosyanın boyutunu küçük tutar ve verilerinizi etkili bir şekilde depolamanıza yardımcı olur.
Taşınabilirlik: CSV dosyaları platformdan bağımsızdır, yani farklı bilgisayarlar ve işletim sistemleri arasında sorunsuzca kullanılabilir.

Projelerde Nasıl Kullanılır?
Veri Depolama ve Paylaşımı
: Projelerinizdeki verileri düzenli bir şekilde saklamak ve başka sistemlerle paylaşmak için CSV dosyalarını kullanabilirsiniz.
Veri Analizi ve İşleme: CSV dosyaları, veri analizi ve işleme için birçok programlama dilinde ve kütüphanede desteklenir. Verileri düzenleyip analiz etmek için kullanışlıdır.
Entegrasyon ve Veri Alışverişi: Farklı uygulamalar arasında veri alışverişi sağlamak için CSV dosyalarını kullanabilir, böylece projenizin farklı kısımlarının birbiriyle iletişim kurmasını kolaylaştırabilirsiniz.


python ile bir csv işliyelim pandas'ı ögrendik demi ? bilmiyorsanız yukarıdaki yazıca acıklıyorum
ve direk koda geçelim acıklamalar var yukarıda

CSV:
import pandas as pd

dosya_yolu = 'ornek_veri.csv'

df = pd.read_csv(dosya_yolu)

print("Başlangıç Verisi:")
print(df)
# Maaşı 5000'den büyük olanları filtrele
secilen_veri = df[df['Maaş'] > 5000]
print(secilen_veri)

kayit_yolu = 'islenmis_veri.csv'
secilen_veri.to_csv(kayit_yolu, index=False)

kodumuz aynı exel ornegındeki gibi çalışır fakat hem daha hızlıdır ve daha basittir virgül ile işi bitirirsiniz

Sonuç olarak, CSV dosyaları basit, hafif ve genel bir veri depolama biçimi sunarken,
Excel dosyaları daha karmaşık veri analizi ve görselleştirmeleri için daha uygun olan özelliklere sahiptir.
İhtiyacınıza ve kullanım senaryonuza bağlı olarak, hangi formatın daha uygun olduğunu seçebilirsiniz.

aklınıza takılan olursa sormayın :D
 
Veri tabanı taşıma* veya sürüm güncellemesi potansiyel arızalarında * bazı sebeplerden bir takım tablo başlıkları altında yer tutan data yeni sürümlerle uyumsuz hale gelebiliyor. Web uygulaması veya diğer veritabanı kullanan uygulamalarda; bu verileri olabildiğince yeni sürümlere uyumlu hale getirmeyi kolaylaştırmak ve veritabanı geçmişinin geçerliliğini korumak önemli olduğu durumlarda @nt 'nin paylaşımı benim konunun uzmanı olmayarak önemli bir hale gelebileceğini öngörmeme neden oluyor. Misalen "regex"/"düzenli ifadeler" kullanarak tarama yapılan data üzerinde "dönüşümlerin"/"güncellemelerin" otomasyonun sağlanması; excel gibi devasa bir office paketinin sistem kaynaklarını kullandığı bir ortamda verilerle boğuşmak mı yoksa gereken tüm değişikliği yapması için bir python scripti kodlamanın peşine düşmek mi ?

Bence Python Scripti daha akılcı bir seçim her ne kadar konu etrafında daha önce denemiş olduğum her hangi bir çalışmam olmasa da; görünen köy kılavuza muhtaç değil.​
 
  • Beğen
Reactions: nt

Çevrimiçi personel

Forum istatistikleri

Konular
6,968
Mesajlar
119,034
Üyeler
2,828
Son üye
beysperi

Son kaynaklar

Son profil mesajları

hakan8470 wrote on Dede's profile.
1717172721760.png
Dedecim bu gul mu karanfil mi? Gerci ne farkeder onu da anlamam. Gerci bunun anlamini da bilmem :gulus2:
Lyewor_ wrote on hakan8470's profile.
Takip edilmeye başlanmışım :D ❤️
Merhaba elektronik tutsakları...
Lyewor_ wrote on taydin's profile.
Merhabalar. Elektrik laboratuvarınız varsa bunun hakkında bir konunuz var mı acaba? Sizin laboratuvarınızı merak ettim de :)
Lyewor_ wrote on taydin's profile.
Merhabalar forumda yeniyim! Bir sorum olacaktı lcr meterler hakkında. Hem bobini ölçen hemde bobin direnci ölçen bir lcr meter var mı acaba?
Back
Top