Lucaccino
Profilo di
Nome | Lucaccino |
---|---|
Indirizzo email | n/a |
Messaggi | 1 |
-
- 2017-11-09 13:53:07
- Seleziona righe da un file csv in base ad un valore contenuto in una colonna
- Forum >> Programmazione Python >> Files e Directory
- Ciao a tutti, mi sono appena iscritto al forum
Mi sto da un po’ di tempo interessando a Python e anche se molto lentamente riesco a fare qualche piccolo progresso, pur essendo agli inizi ed avendo ancora molto da imparare a riguardo.
Ho questo problema:
ho un certo numero files csv ognuno relativo ad un individuo contenente dati genetici
Da ognuno di questi vorrei estrapolare i dati contenenti ad esempio quelli con la colonna Chr = Y
Sono riuscito a fare questa cosa, ma solo per un unico file alla volta
Questo è il codice che ho scritto
import pandas as pd
df = pd.read_csv('Ind1.csv')
print df
df1 = df[df['Chr']=='Y']
df1.to_csv('NewInd1.csv', sep=',', decimal='.', index=False)
questo è il file di input usato (in formato csv)
SNP,Chr,Allele1,Allele2
SNP01,Y,A,A
SNP02,Y,B,B
SNP03,X,C,C
SNP04,mt,D,D
SNP05,mt,E,E
e questo il file di output risultante
SNP,Chr,Allele1,Allele2
SNP01,Y,A,A
SNP02,Y,B,B
questo è solo un piccolo esempio, la lunghezza di ciascun file supera le 100000 righe e di questi ne ho diversi, quindi l'ideale sarebbe analizzare i files contenuti in una directory e salvarli in una seconda
ringrazio in anticipo chi può darmi una mano
allego dei files di esempio
--- Ultima modifica di Lucaccino in data 2017-11-09 13:56:59 ---