AI hindab veebisaite, jäljendades päris inimesi ja isegi ületab neid. Kuidas seda tehakse?

Täna läheb avalikuks intelligentse veebisaidi ümberkujundussüsteemi uKit AI üks komponente. See on prototüüpide moodul veebilehtede ilu hindamiseks. See ühendab närvivõrgu ja otsustuspuud, et jäljendada tavakülastaja reaktsiooni veebisaidi kujundusele.

Tulevikus hindab selline moodul generatiivse disainialgoritmi tööd, mis on uKit AI põhielement, mis kujundab lehti ilma inimeste kaasamiseta, tuginedes olemasolevale sisule ja „teadmistele” mitteefektiivse veebisaidi ja ühe eesmärk oli ümberarvestuskursi suurendamine.

Praegune WebScore AI versioon kajastab keskmise Interneti-kasutaja vaadet veebisaidi väljanägemise kohta. Ehkki saame luua ka muid võimalusi, näiteks on veebisaidi kasutatavust võimalik hinnata.

Süsteemi koolitamiseks kasutatavad veebisaidid. Esiteks oleme kokku kogunud 12 000 saiti ja veebipoodi, mis on loodud erinevatel aastatel erinevatel platvormidel ja erinevates keeltes. Peamine ülesanne oli saada piisavalt visuaalse gradatsiooni näiteid, alates päris halbadest veebisaitidest kuni väga headeni. Nii oleme süsteemile näidanud, mida see kaasaegses veebis ette võib tulla.

Paar veebisaiti koolitusproovist.

Iga astmestikku mõõdetakse skaalaga ja seda skaalat peaks mõistma tavaline inimene, kelle arvamust proovime modelleerida. Niisiis tulime välja idee skaalal 1 kuni 10, mida meie teenuses kasutatakse.

Inimesed, keda jäljendab WebScore AI. Erinevatelt veebisaitidelt andmekogumi (treeningmudeli andmete komplekti) moodustamiseks oli vaja kahte asja:

  • märgid, mille abil süsteem teeb kindlaks, kas veebisait on atraktiivne;
  • hinnangud (hinded), mis on tehtud meie skaala abil teatud hulga veebisaitide jaoks. Nendest saab süsteemi eeskuju.

Keegi peaks need esialgsed hinnangud panema. Selline „õpetaja” või „õpetajate” rühm, mis konkreetsem on, mõjutab suuresti mudeli toimimist.

Veebisaitide hindamisliides: võtke meie GitHub peagi kasutusele ja kasutage seda.

Fookusgrupi kogumiseks viisime kandidaatide eelvaliku läbi 1500 veebisaidi näites. Rutiinne, kuid vastutustundlik töö, mis nõuab suurt keskendumist. Eelvalik aitas meil ebasobivad kandidaadid kõrvaldada ja valimisse jätta ka vastuolulised (kui keegi hindab seda 1 ja teine ​​10-le) veebisaidid.

Alguses katsetasime hindamismeetodeid.

Näiteks pakkusime hinnata ühte veebisaiti korraga, seejärel kahte veebisaiti korraga või valida kahest kõige atraktiivsema veebisaidi. Kõige paremini toimis lähenemisviis, kus vastaja nägi ühte veebisaiti ja hindas seda. Kasutasime seda 10 000 ülejäänud veebisaidi hindamiseks.

Inimene hindas, kas veebisait on ilus või mitte. Kuidas masin seda teeb? Sina ja mina vajame vaid ühte pilku, et kujundada arvamus millegi üldise ilu kohta. Kuid me teame, et kurat on detailides.

Veebisaidi visuaalse atraktiivsuse märgid, mis juhendavad mudelit, on kogu projekti võtmehetk. Palusime uKiti veebisaidi ehitaja disainimeeskonnalt kätt, nende tööd kasutatakse sadade tuhandete veebisaitide alusena ja miljonid inimesed näevad seda. Oleme koos koostanud laiendatud loetelu funktsioonidest, millele spetsialistid veebisaidi kujunduse väljatöötamisel tähelepanu pööravad. Ja siis proovisin seda lõigata, jättes alles ainult kõige olulisemad.

uKit.com disainimeeskond.

Selle tulemusel saime kontrollnimekirja 125 erinevast, kuid samas olulisest kriteeriumist, mis on jaotatud viieteistkümnesse kategooriasse. Näiteks on loendis kohandamine populaarsetele ekraanidele, mitmesugused kirjasuurused, värvide puhtus, pealkirjade pikkus, piltide osakaal kogu lehel jne. Järele jääb vaid mudeli väljaõpetamine nende reeglite abil.

Koostage algoritm. Mis on täpselt õpetamismudel? See on algoritmi konstrueerimine, mis põhineb antud omaduste komplektil ja võimaldab valitud veebisaiti hinnata. On soovitav, et süsteemi hindamisel ja keskmise õpetaja hinnangul oleks lõpphindamisel minimaalne erinevus.

Oleme otsustanud kasutada otsustuspuude puhul gradiendi suurendamise meetodit, kuna see on üks populaarsemaid ja tõhusamaid lähenemisviise. Põhialgoritme kasutades konstrueerib see komplekti, mille üldine tulemus ületab mis tahes eraldi algoritmi tulemusi.

Lisaks sellele püüab iga järgnevat põhialgoritmi lisada kogu komplekti vastuste kvaliteet.

Protsessi kiirendamiseks ja hõlbustamiseks kasutasime Yandexi CatBoosti teeki, mis võimaldab luua nn grammomeetrilisel võimendil niinimetatud unarusse jäävate otsustuspuude jaoks, et tagada mudeli hea treenimisvõime algusest peale ja kiire üleminek ennustuste (hinnangute) pakkumisele ) uute objektide jaoks.

Neuraalvõrgu lisamine. Kui põhialgoritm oli valmis, otsustasime katse läbi viia: kas tulemused paranevad, kui lisame närvivõrgu? Tegelikult teadsime juba, kuidas veebisaiti ja selle kujundust vaadata, ning nüüd otsustasime anda süsteemile mingi suurendusklaasi, mida saab kasutada veelgi detailide ilmutamiseks.

Valisime ühe populaarseima võrgu Resnet50, see on tuntud kui hea algoritm kõrgetasemeliste funktsioonide eraldamiseks. Ja oleme õppinud, kuidas saada 1000 täiendavat atribuuti veebisaidi hindamiseks. Selle tulemusel iseloomustab süsteem nüüd URL-i kokku 1125 funktsiooni järgi ja leiab veebisaidi koha 10-pallisel skaalal. Protsess võtab kuni mitu tosinat sekundit, sellepärast kaalume mudeli kiirendamist, vähendades märkide arvu, hoides samal ajal hindamise kvaliteedi samal tasemel.

Esimesed tulemused. Sel viisil koolitatud mudel võiks anda üksikute „õpetajate” omadega võrreldes kolm korda täpsemat hinnangut.

Võib öelda, et mudel ületas oma esimesi õpetajaid, kuna fookusgrupi hinnangud erinevad keskmisest tunduvalt rohkem kui närvivõrgu hinnang. Nüüd panime algoritmi täiendõppeks võrku. Ja sinust võib saada ka selle õpetaja.