Pagerinkite savo Kategorijų klasifikavimas modelio našumą
Jei jūsų modelio našumas nėra toks, kokio norėtumėte, yra keletas dalykų, kuriuos galite išbandyti. Šie patarimai gali padėti patobulinti modelį, kad pagerintumėte jo nuspėjamąją galią.
Pridėkite daugiau teisingai pažymėtų treniruočių duomenų
Kuo teisingiau pažymėtus treniruočių duomenis turėsite, tuo geriau veiks jūsų modelis. Pavyzdžiui, tarkime, kad turite "taip" / "ne" etiketę. Jei daugumos jūsų duomenų šiame stulpelyje yra tik "Taip ", jūsų AI modelis tikriausiai daug ko neišmoks iš šių duomenų. Jei jūsų duomenys nėra tinkamai pažymėti, modelis tikriausiai nesimokys labai gerai. Idealu pradėti nuo nedidelio teisingai pažymėtų pavyzdžių rinkinio - galbūt 100 ar mažiau. Iš ten galite ir toliau kartoti pavyzdžių skaičių iteratyviai ir kiekvieną kartą persikvalifikuoti, pažymėdami našumo pokyčius. Paprastai kalbant, daugiau duomenų yra geriau, tačiau duomenų pridėjimo grąža mažėja, kuo didesnis jūsų duomenų rinkinys.
Daugiau patarimų
- Įsitikinkite, kad žymų naudojimas treniruočių duomenyse yra subalansuotas. Pavyzdžiui: turite keturias žymes 100 teksto elementų. Dvi pirmosios žymės (tag1 ir tag2) naudojamos 90 teksto elementų, tačiau kitos dvi (tag3 ir tag4) naudojamos tik likusiems 10 teksto elementų. Dėl pusiausvyros trūkumo jūsų modeliui gali būti sunku teisingai numatyti žymą3 arba žymą4.
- Įsitikinkite, kad apmokėte modelį naudodami duomenis, panašius į tuos, kuriems tikitės naudoti modelį.
Tolesnis veiksmas
Paskelbkite savo Kategorijų klasifikavimas modelį