Forum >> Programmazione Python >> Files e Directory >> Seleziona righe da un file csv in base ad un valore contenuto in una colonna

Pagina: 1

Ciao a tutti, mi sono appena iscritto al forum
Mi sto da un po’ di tempo interessando a Python e anche se molto lentamente riesco a fare qualche piccolo progresso, pur essendo agli inizi ed avendo ancora molto da imparare a riguardo.
Ho questo problema:
ho un certo numero files csv ognuno relativo ad un individuo contenente dati genetici
Da ognuno di questi vorrei estrapolare i dati contenenti ad esempio quelli con la colonna Chr = Y
Sono riuscito a fare questa cosa, ma solo per un unico file alla volta

Questo è il codice che ho scritto

import pandas as pd
df = pd.read_csv('Ind1.csv')
print df
df1 = df[df['Chr']=='Y']
df1.to_csv('NewInd1.csv', sep=',', decimal='.', index=False)

questo è il file di input usato (in formato csv)

SNP,Chr,Allele1,Allele2
SNP01,Y,A,A
SNP02,Y,B,B
SNP03,X,C,C
SNP04,mt,D,D
SNP05,mt,E,E

e questo il file di output risultante

SNP,Chr,Allele1,Allele2
SNP01,Y,A,A
SNP02,Y,B,B

questo è solo un piccolo esempio, la lunghezza di ciascun file supera le 100000 righe e di questi ne ho diversi, quindi l'ideale sarebbe analizzare i files contenuti in una directory e salvarli in una seconda

ringrazio in anticipo chi può darmi una mano
allego dei files di esempio


--- Ultima modifica di Lucaccino in data 2017-11-09 13:56:59 ---
Allegati


Pagina: 1



Esegui il login per scrivere una risposta.