Forum >> Programmazione Python >> Database >> sklearn.naive_bayes.MultinomialNB

Pagina: 1

Buonasera a tutti, sono alle prime armi con Machine Learning e con i classificatori. Ho un file con tante features e all'interno di ogni feature ho dei valori come: url, permission, activity, api_call, etc... Quindi ogni feature ha un formato di questo tipo:

intent::android.intent.action.MAIN
activity::.AppEntry
permission::android.permission.INTERNET
intent::android.intent.category.LAUNCHER
call::getPackageInfo
activity::Habitz

E in oltre ho un altro file in cui sono indicati i nomi di alcune features e queste sono associate alla classe malware di appartenenza.

stavo provando ad utilizzare il classificatore Naive Bayes Multinomial, per cui ho:

importato la libreria

creato il classificare-> clf = MultinomialNB()

ho splittato il mio dataset in dati per il train e dati per il test
X_train, X_test = train_test_split(lista_file_feature, test_size=0.7, random_state=int(time.time()))

adesso dovrei utilizzare la funzione .fit(X,Y) il problema che non riesco a capire quali parametri devo passare alla funzione, ovvero cosa si intende per X e Y? Ho letto che X è il vettore di allenamento e Y il vettore di destinazione, ma continuo a non capire.

Grazie in anticipo a chi mi aiuterà


--- Ultima modifica di marina in data 2018-11-14 01:20:41 ---

--- Ultima modifica di marina in data 2018-11-14 01:20:58 ---


Pagina: 1



Esegui il login per scrivere una risposta.