Sistemul de auto-completare din cautarea de la Google si defaimarea online
Marturisesc ca am fost placut impresionat de sistemul de auto-completare a cautarilor din Google (Google Suggest), desi nu am putut sa nu ma intreb (si am intrebat si pe altii mai priceputi decit mine) in ce masura nu “perverteste” intentia de cautare intiala a utiizatorului (de. ex. vad in autocomplete o cautare similara cu ce vroiam eu si o aleg).
Am auzit insa in ultima vreme mai multe cazuri in care sistemul de autocomplete al lui Google le-a creat probleme juridice, in special pe cazuri de defaimare. Adica cum ar fi sa iti cauti numele pe Internet, si Google sa iti sugereze “Numele tau hot” sau “Numele tau frauda".
Evident ca nu iti pica bine. Dar poate fi Google vinovat in cazul de fata ? Sau vorbim de un algoritm pur matematic? (ce depinde de ce cauta altii si/sau rezultate)
Cum am auzit de cazuri din Franta, Suedia, Brazilia sau, mai recent Italia, este clar ca poate fi o problema din ce in ce mai raspindita.
Este posibil ca una din solutiile cele mai simple este ca motorul de cautare sa refuze sa ofere auto-complete pe numele proprii. Dar numele proprii sunt cele si ale presedintilor de stat sau a celor morti de acum 2 secole, deci ar fi mai degraba o limitare inutila a libertatii de exprimare. O directie in acest sens ar fi sistemul pus de Google pentru gestionarea reputatiei tale online (vazut la Manafu, thanks!), care insa pare a fi doar la inceput. (si care poate fi si o implementare a mult-discutatului - dar nereglementat inca in mod explicit - drept la uitare (droit a l’oubli))
Si, totusi, un caz recent din Irlanda (inca pe rol) care implica rezultatele autocomplete pentru un hotel, caruia ii sunt asociate diverse cuvinte negative ne arata ca problema poate sa se iveasca si dincolo de o persoana fizica.
Probabil ca Google ar putea pretinde oricind ca rolul sau este pur tehnic si neutru, deci reprezinte un pur gazduitor (de fapt agregator) al informatiei deja existente. Iar cazul de la ECJ din 2008 referitor la Adwords ar fi un bun precedent de folosit in intreaga UE. Dar asta o poate face doar cand serviciul sau are o functie neutra “întrucât comportamentul său este pur tehnic, automat și pasiv, presupunând lipsa cunoașterii sau a controlului datelor pe care le stochează.”, cum sublinieaza Curtea Europeana de Justitie.
Doar ca motorul de cautare se pare ca deja a renuntat la statutul de rol neutru si pasiv atit pentru Google Suggest, cat si pentru Google Instant, pentru unele cuvinte, unde presiunea industriei de copyright a fost prea mare. Cuvinte ca BitTorrent, torrent, utorrent, RapidShare sau Megaupload nu mai merg pe auto-complete de la inceputul anului.
In 2010, purtatorul de cuvint ai firmei se apara:
“Este important de precizat că Google Suggest este o agregare a celor mai populare căutări, bazată pe căutările anterioare ale internauţilor. Nu este Google cel care sugerează aceşti termeni”
Poate nu o sugera, dar deja ne arata ca poate sa le blocheze. Daca vrea.
Personal, cred ca as fi mai degraba suporterul unui serviciu total liber (sau neutru), decit unul trunchiat de interese comerciale evidente. Pentru ca atunci par sa conteze doar interesele comerciale ale celor ce pot sa faca lobby si nu a persoanelor fizice sau a micilor intreprinzatori care au doar ca varianta inca doar complicata actiune in instanta.
De multa vreme era de amuzament sa pui numele unor politicieni in google si sa vezi sugestiile. Interesant ca sugestiile cu conotatie negativa au inceput sa dispara de pe google.ro dar raman pe google.com.
Nu cred ca se poate rezolva problema fara un algoritm de eliminare completa a atributelor gramaticale din sugestii. Dar asta ar face destul de schiop acest serviciu care altfel e foarte util daca nu iti vine pe loc ideea cum sa formulezi o intrebare care sa te duca la cele mai bune/relevante raspunsuri pe care le cauti si tu si multi altii cu aceeasi problema ca a ta in miliardele de pagini.
Interesant e cum tehnica si AI-ul, pentru a se racorda la mintea umana, necesita din partea noastra o gandire in SMS-uri si Tweet-uri pentru ca sunt singurele care pot fi simulate si de un computer si sa aiba un sens. Dar asta e alta discutie. :)