Hyvin jäsennellyt ja helposti saatavilla olevat tietojoukot ovat nykyään ratkaisevan tärkeitä tutkijoille, kehittäjille, data-analyytikoille ja jopa markkinoijille. CSV-tietojoukon luominen on yksi yleisimmistä näiden ammattilaisten esittämistä kyselyistä. CSV (Comma-Separated Values) on tiedostomuoto, jota käytetään yleisesti tietojen luomiseen, tallentamiseen ja jakamiseen taulukkomuotoon. Ja jos työskentelet säännöllisesti erityyppisten tietojoukkojen kanssa, CSV-tietojoukon luominen voi olla myös sinun kysymys.
CSV-tiedosto ei ole pelkkää tekstiä, jossa on useita pilkuilla erotettuja arvoja, vaan se voi olla hyödyllinen resurssi, jos käsittelet säännöllisesti koneoppimisprojekteja, datan visualisointia ja paljon muuta. CSV-tietojoukon luominen on kuitenkin paljon helpompaa kuin luulet. Tarvitset vain oikean tavan tehdä se. Ja sitä varten sinun on ensin ymmärrettävä, kuinka luodaan CSV-tietojoukko ja mikä on CSV-tietojoukko. Joten aloitetaan.
Mikä on CSV-tietojoukko?
CSV on pelkkä tekstitiedosto, jossa jokaisella rivillä on rivi dataa ja jokainen arvo on erotettu pilkulla (,). CSV on laajalti käytetty muoto, jota käytetään periaatteessa tärkeiden tietojen vaihtamiseen henkilökohtaisesti ja jopa ammattimaisesti yksinkertaisella ja yhteensopivalla tavalla. Jotkut avainmerkit ovat sen tekstipohjaisia ja ihmisluettavia muotoja, jokainen rivi koostuu yhdestä tietueesta, kaikki yksittäiset arvot on erotettu pilkuilla ja tukee taulukkomuotoa tietojen säilyttämiseksi. Sitä voidaan käyttää myös koneoppimisessa. Se voidaan avata Google-taulukoilla, Excelillä, tekstieditorilla tai useilla ohjelmointikielillä, kuten SQL, R, Python.
Suositeltu luettava:Mikä on tietojoukko koneoppimisessa? Kattava opas
Miksi käyttäjien on luotava CSV-tietojoukko?
- CSV-tietojoukko on tarpeeksi yhteensopiva käytettäväksi Excel-taulukoiden, tietokantojen ja koneoppimistyökalujen kanssa.
- Ne ovat kevyitä ja myös erittäin kannettavia käyttää käyttäjien tarpeiden mukaan.
- Koulutustietojoukon ylläpitäminen koneoppimista varten.
- Sekä ihmiset että koneet voivat helposti lukea ja ymmärtää nämä tiedostot.
- Toimii hyvin useiden ohjelmointikielien kanssa.
Lue myös: Tietoa koneoppimisen tietojoukosta
Tietojoukon luominen CSV-tiedostoon Microsoft Excelillä
- Ensinnäkinavaa Microsoft Exceljärjestelmässäsi.
- Kun olet avannut Excelin, napsauta "Tiedosto" -painiketta ja napsauta "Tallenna nimellä”.
- Tiedoston nimen alla alareunassa, jossa olet tiedoston tallennusnäytössä, näet vaihtoehdon "Tallenna tyyppinä.” laajenna luetteloa ja valitse "CSV (pilkuilla eroteltu).”
- Tämän jälkeennimeä tietojoukkotiedostosi,valitse sijaintitallentaaksesi sen ja napsauta "Tallentaa”vaihtoehto.
- Lopuksi näytölle ilmestyy kaksi ponnahdusikkunoita varoittavaa valintaikkunaa eri muotoilun vuoksi. Napsauta "OK" -painiketta ensimmäisessä näkyviin tulevassa valintaikkunassa ja "KylläOlet nyt tallentanut CSV-tiedoston järjestelmääsi ja voit käyttää Dataset-tiedostoa tarpeidesi mukaan.
Google Sheetsin käyttäminen CSV-tietojoukon luomiseen
- Ensinnäkinavaa Google Sheets.
- Syötä tietosijonka haluat tietojoukkoon.
- Mene nyt kohtaanTiedostoklikkaaLataa-painiketta.
- ValitaPilkuilla erotetut arvot (.csv)tallennusvaihtoehtoluettelosta.
Tietojoukon luominen CSV-tiedostoon tekstieditorilla
- Avaa mikä tahansa tekstieditorikuten Notepad, Notepad++, Sublime text jne.
- Kirjoita tietosi manuaalisestiesimerkiksi:
Nimi, ikä, sähköpostiosoite
John, 28, [sähköposti suojattu]
Siri, 29, [sähköposti suojattu] - Kun olet valmis,tallenna tiedostosi .csv-muodossa
Pythonin käyttäminen CSV-tietojoukon luomiseen
Tuo csv
data = [
["Nimi", "Ikä", "Kaupunki"],
["bob", 30, "New York"],
["john", 25, "Los Angeles"]
]
jossa open("dataset.csv", "w", newline="") tiedostona:
kirjoittaja = csv.writer(tiedosto)
kirjoittaja .writerows(data)
tuo pandat pd-muodossa
df = pd.DataFrame({
"Nimi": ['bob', "john"],
"Ikä": [30, 25]
"Kaupunki": ['New York', 'Los Angelos']
})
df.to_csv('dataset.csv', index=False)
Vinkkejä, jotka kannattaa muistaa luotaessa puhdasta CSV-tietojoukkoa
- Sisällytä otsikko selvyyden vuoksi aina, kun luot CSV-tietojoukon.
- Vältä ei-toivottuja erikoismerkkejä.
- Valitse yhteensopiva menetelmä CSV-tietojoukon luomiseksi.
- Varmista aina, että tarkistat CSV-tiedostosi.
Johtopäätös
Tämän artikkelin lopuksi keskustelitte useista menetelmistä poistaaksesi epäilyksesi CSV-tietojoukon luomisesta helposti. Olemme maininneet joitain mahdollisia menetelmiä CSV-tietojoukon luomiseksi helposti. Voit valita sinulle sopivan menetelmän tarpeidesi ja mieltymystesi mukaan. Nämä menetelmät vaativat myös jonkin verran teknistä tietämystä, ja jotkut ovat helppokäyttöisiä. Sinun on myös noudatettava vinkkejä ennen kuin luot tietojoukon CSV-datatiedostoillasi.
Jos tarvitset lisäapua tietojoukon luomiseen CSV-tiedostoon, voit ottaa yhteyttä tekniseen tukitiimiimme milloin tahansa, koska he ovat aina käytettävissäsi auttamaan sinua kaikissa teknisissä kysymyksissäsi.
Lue seuraavaksi: Helpoin tapa luoda tietojoukko JSONista
