Profilo di marina

Nome marina
Indirizzo email n/a
Messaggi1
  • sklearn.naive_bayes.MultinomialNB
    Forum >> Programmazione Python >> Database
    Buonasera a tutti, sono alle prime armi con Machine Learning e con i classificatori. Ho un file con tante features e all'interno di ogni feature ho dei valori come: url, permission, activity, api_call, etc... Quindi ogni feature ha un formato di questo tipo:

    intent::android.intent.action.MAIN
    activity::.AppEntry
    permission::android.permission.INTERNET
    intent::android.intent.category.LAUNCHER
    call::getPackageInfo
    activity::Habitz

    E in oltre ho un altro file in cui sono indicati i nomi di alcune features e queste sono associate alla classe malware di appartenenza.

    stavo provando ad utilizzare il classificatore Naive Bayes Multinomial, per cui ho:

    importato la libreria

    creato il classificare-> clf = MultinomialNB()

    ho splittato il mio dataset in dati per il train e dati per il test
    X_train, X_test = train_test_split(lista_file_feature, test_size=0.7, random_state=int(time.time()))

    adesso dovrei utilizzare la funzione .fit(X,Y) il problema che non riesco a capire quali parametri devo passare alla funzione, ovvero cosa si intende per X e Y? Ho letto che X è il vettore di allenamento e Y il vettore di destinazione, ma continuo a non capire.

    Grazie in anticipo a chi mi aiuterà


    --- Ultima modifica di marina in data 2018-11-14 01:20:41 ---

    --- Ultima modifica di marina in data 2018-11-14 01:20:58 ---