In timp ce scriam acum cateva zile despre motoarele de cautare de abia aparute: Okidoki, Baluba si Yoozila ma gandeam ca web-ul romanesc a definit pe rand aceste motoare de mai sus fiind “primul motor de cautare romanesc”.
Care este insa primul motor de cautare romanesc?
Din ceea ce stiu eu Murfi este primul motor de cautare (se poate ca zoohoo sa fi aparut mai devereme). La inceput a fost o combinatie de mai multe scripturi gen Sphider, PHPDig insa pe parcurs a evoluat in un mototr de cautare cu cod scris inhouse (datele sunt de la proprietarul siteului: Eugen Petcu). Numele de murfi provine de la berea irlandeza Murphy.
Din ceea ce stiu eu motorul a trecut prin multe modificari, reindexari, a fost revigorat din nou spre sfarsitul anului 2008 si vine cu cateva noutati. Ideea lui Eugen este sa deie “power to the people”. Dupa cum spune el:
Evident ca lucrul la fel de important este relevanta. Noutatea, daca vrei in cazul lui murfi, ar fi ca eu NU mai incerc sa construiesc un algoritm perfect (pentru ca nu exista asa ceva si nu va exista vreodata) pentru relevanta rezultatelor, ci incerc sa dau “power to the people” – de aici si X-ul la rezultate… care sper sa fie gata foarte repede.
Desi nu e neaparat bazat pe un CSS web 2.0 si nu are indexate probabil mai multe de 200.000 de pagini indexate, murfi este un motor care INCA este in dezvoltare. Lucru laudabil, probabil cu potential destul de mare. As vrea sa il mai citez odata pe Eugen:
Ce este foarte important, cred eu, este ca, rezultatele sunt pur si simplu cele care ies in urma calcului importantei unei pagini, si nimeni si absolut nimic nu intervine in rezultate. Am multe siteuri personale care NU ies primele la rezultate, desi mi-as dori … cel mai mult acum si oricand in viitor ma intereseaza sa construiesc incredere.
Gata cu laudele, iata comentariile si criticile mele:
- exista optiunile de preferinte, cautare avansata etc insa sunt ascunse si nu exista o interfata vizuala pentru a le alege
- o parte mica din siteurile mele sunt indexate si ma indoiesc ca ei le stiu pe toate
(am folosit functia de adaugare de site nou, si astefel am sugerat un nou site; de amintit ca okidoki inca nu a indexat absolut nici unul dintre sugestiile mele )
- un pic cam putine rezultate, insa asta e probabil din cauza numarului de siteuri indexate (din cate stiu eu 200.000), insa rezultatele obtinute sunt curate, nu am observat inca spammy sites
- reclame publicitare nu exista inca, insa e clar in test un sistem de reclama (eu am dat din intamplare peste el
, exista 2-3 publisheri de test cred)
- ca si la baluba ar trebui puse sus pagini de politica de confidentialitate, termeni si conditii
- siteul nu este valid W3c din pacate (baluba si okidoki la fel ), codul e in table scris
- exista un blog Murfi (foarte de curand lansat) si un cont de Twitter pentru murfi
- in lista de rezultate apar icoanele (favicons) pentru fiecare site gasit ceea ce face uneori ca pagina de rezultate sa se incarce fooooarte incet (caching ar putea fi solutia?!)
- problemele mari sunt la modul de indexare, multe rezultate au titlul si descrierea gresita (am verificat manual si ele contin deja un meta tag titlu si description corect deci e o problema de indexare, ex. ztv.ro)
- legat de relevanta, din ceea ce am testat cautari exacte pe cuvinte cheie care nu au concurenta paginile nu au aparut, sau e o problema de legatura intre cuvant cheie –> pagina, sau e lipsa de pagini indexate
- titlul si descrierea sunt fomatate dubios (litere mari, lipsesc semnele de punctuatie, astfel incat rezultatele sunt o insiruire de cuvinte, bug maybe?)
- surpriza este posibilitatea de vot pe anumite rezultate, lucru care sper sa nu fie abuzat
Concluzia? Mult inca de lucru la el, multe lucuri marunte inca de rezolvat. Cu o astfel de vechime in spate eu spun ca potentialul exista, insa trebuie investit in el ore bune de coding. Mult success si sper ca parte din cele de mai sus sa le rezolve cat de repede, sper ca nu am suparat pe nimeni din nou
(Orlando a refuzat sa imi publice comentariul in care intrebam de ce nu indexeaza sugestiile CHIAR daca anuntase acest lucru in un blog post acum cateva zile).


Salut Marius, in primul rand iti multumesc pentru articol. O sa incerc sa acopar toate semnele de intrebare din articol cu cate un raspuns, sper sa nu uit nimic…
1 – Nu as spune ca a fost primul… In mod sigur nu a fost primul, printre primele cred ca e mai corect.
2 – Cand m-am gandit ca vreau sa fac un motor de cautare romanesc – nici nu mai stiu de la ce mi-a pornit asta in cap – habar nu aveam cum sa il fac, ce trebuie sa contina, etc… Nu stiam mare lucru despre acest domeniu. Motiv pentru care am incercat sa vad cum au facut altii. Am citit cat am putut despre Google, am cautat scripturi facute de altii sa vad cum au abordat ei problema, practic m-am apucat sa invat. Usor, usor, am dobandit atatea cunostinte incat sa renunt la orice script initial si sa incep sa scriu cod de la 0. Azi, murfi.ro are concept, cod, structura, tot 100% creatie proprie, si chiar daca este departe de a fi perfect, sunt mandru de ce a iesit.
3 – Multi au intrebat de nume, de unde vine, si ce legatura are cu Romania sau cu romanii… Nici una! Nu cred ca numele, cel putin in acest caz, ar fi trebuit sa fie neaparat romanesc sau sa exprime in intr-un fel ceva romanesc. Pana la urma, nu numele conteaza, ci ceea ce stie sa faca.
4 – Pentru murfi conteaza, in primul rand relevanta. De aceea am introdus sistemul acela de vot al relevantei unei pagini, de care te si va asigur ca nu abuzeaza nimeni, nici macar eu. Am avut pana acum 3 cazuri de vot eronat – in care probabil au incercat sa manipuleze serp-ul, dar votul a fost anulat. De asemenea, am avut multe voturi corecte, bune si de care am tinut cont.
5 – Ai dreptate, foarte multe dintre optiuni fie sunt inca ascunse, fie nu sunt inca implementate. Unele nu sunt gata 100%, unele sunt in teste private. Cred ca asa e normal, sa fie eliberate public atunci cand functioneaza bine si isi ating scopul pentru care au fost create.
6 – Avem foarte putine pagini indexate, raportat la ce am putea avea. Asta doar din cauza faptului ca nu avem un trust puternic in spate si partea logistica ar insemna foarte mult financiar, insa pentru 2009, o parte din aceste probleme de logistica vor fi rezolvate.
7 – Siteul va fi valid cand alte probleme mai importante, cum ar fi relevanta, vor fi aproape de a fi rezolvate. Nu este o prioritate acum.
8 – Exista inca in indexul nostru pagini cu “Document fara titlu” sau cu titluri eronate, din cauza unui bug la versiunea anterioara de crawler. Unele dintre ele au fost reparate paginile fiind reindexate, alte urmeaza sa fie reindexate.
9 – Pe relevanta avem inca multe lipsuri si datorita indexului mic. Din 3 paie e cam greu sa hranesti 3 magari, daca imi permiteti comparatia.
10 – Concluzia: da, mai este de lucru la el foarte mult, mai avem de investit in el foarte mult, insa, cred ca suntem pe drumul cel bun,si chiar daca unii critica distructiv, noi ne vom vedea de treaba si poate, intr-o zi, vor exista si voci care sa spuna: “Da, functioneaza si functioneaza bine!”. Multumesc si sper ca nu v-am plictisit.
[...] Scris de Marius Mailat la data de 07 Jan 2009 06:32 pm | Categoria: Noutati SEO Inca un motor de cautare romanesc aparut? Multumesc lui Eugen Petcu pentru avertizarea aparitiei motorului de cautare Zuzuka. Scriam anul trecut de lansarea Okidoki, Baluba si Murfi si eram atunci incantat/sceptic ca se poate incepe un proiect de marimea unui motor de cautare care in cativa ani sa se lupte cu Google. [...]
[...] – lipseste optiunile de preferinte, cautare avansata, cautare in fisiere de tip diferite – aproape toate siteurile mele sunt indexate, din pacate nu exista optiunea de adaugare desi am cautat o astfel de optiune – rezultate sunt intradevar numeroase (probabil e din cauza ca se foloseste si yahoo+google), insa am observat o multime de rezultatele si cautari dubioase. Indexate in google sunt multe pagini dubioase. – reclame publicitare nu sunt inca – nu exista pagini de politica de confidentialitate, termeni si conditii, contact sau alt fel de informatii despre motor – siteul nu este valid W3c din pacate, codul HTML e scris foarte dezordonat, se poate curata si eventual si css-ul inline mutat in fisierul extren de css si renuntat la code gen “div style=width:90%; margin:0 auto” – foloseste thumbs de la ShrinkTheWeb care uneori sunt incete, poate o solutie mai eleganta si mai rapida este un caching local? – un design mai apropiat de 2009 nu ar strica – probabil ca review-ul meu a venit foarte repede, insa odata cu aparitia celorlalte motoare de cautare precum Murfi, Okidoki, Baluba, Zuzuka concurenta devine mai mare [...]
[...] Scris de Cristina Mailat la data de 16 Jan 2009 09:41 am | Categoria: Motoare de cautare Incepand cu luna decembrie 2008 am relatat despre noile motoare de cautare romanesti precum Zuzuka, Okidoki, Baluba, Scormoneste si unul deja existent Murfi. Am considerat ca o astfel de analiza este benefica si poate sa stimuleze un potential competitor pentru Google.ro [...]