Raspundem bloggerilor

Cum functioneaza Add comments

1. Incepem cu Arhi care pune niste intrebari foarte pertinente, in stilul sau caracteristic

A. De ce Cabral de pe 2 in zelist, da mai putin decat Tudor Chirila de pe locul 4.

Raspunsul in forma cea mai simpla esteΒ  ca scorul se imparte la mai multe linkuri. Algoritmul de clasificare, similar cu cel de la PR-ul Google, e ca un procent din scorul pe care il are un blog este impartit la toate linkurile de pe prima pagina a respectivului blog. Ai mai multe linkuri, dai mai putin pe link.

2. De ce nu nu ii apar toate linkurile care duc catre el?

Noi luam in calcul in doar linkurile de pe prima pagina a blogurilor din momentul parsarii (din blogroll si din posturi). Daca linkurile sunt pe alte pagini sau nu au fost puse inca la momentul parsarii pentru refacerea topului (in fiecare marti) atunci linkurile nu apar. Idem daca blogul care se doreste parsat este inaccesibil.

Asa functioneaza topul acum. Ideea de a lua in considerare si celelalte posturi din respectiva saptamana nu este deloc rea (si probabil o vom implementa cand gasim timp).

3. Nelamuririle noastre la cuvintele lui Arhi: “E rau ca nu recunosti ca sistemul greseste si grav. Tocmai ti-am dovedit ca vorbele tale nu valoreaza nimic si ca ZeList e un top facut un pic dupa ureche. Nu?

– Exact unde greseste? Avem o metodologie gresita? Furam la cantar? Suntem vanduti mafiei?

Asteptam raspunsuri de la Arhi la intrebarile noastre, asa cum si noi ne-am facut timp sa raspundem observatiilor noastre, atat cat am putut de repede.

(revin cu celelalte raspunsuri – dupa intalnirea la care cred ca tocmai am intarziat)

28 Responses to “Raspundem bloggerilor”

  1. Dan Selaru Says:

    Deci conform algoritmului e suficient sa-mi sterg blogroll-ul martea si creste pozitia. Pot sa-mi fac 30 de bloguri, sau 300, sa le leg de al meu si creste pozitia. Nu las comentarii si creste pozitia. Nu citez si creste pozitia. Acum ca stiu cum functioneaza ma gandesc sa-l bat pe zoso. Glumesc dar mai trebuie muncit. Ceva cu trafic, comentarii. In felul in care e facut aduce a mafie.

  2. Arhi Says:

    a. nu este normal ca locul 1 dintr-un top sa ofere punctaj mai mic decat locul 4. is wrong in any way you like it. total subiectiv si irelevant. atunci de ce mai tineti topul?
    b. iarasi e totalmente gresit sa iei in considerare linkurile doar de pe index. asta ar insemna ca e suficient sa vb cu tot top 10 ca marti si miercuri, cand spuneti voi ca parsati, sa imi puna link pe index. sau sa ii rog sa nu mai posteze. realizati ca sistemul vostru nu e o clasificare, ci o ruleta a sansei? cine are norocul sa aibe link pe index la zoso marti, e om facut. daca a ratat cu 5 minute, aia e, el nu exista.
    c. am explicat la punctele a si b de ce greseste grav, de ce e o metodologie gresita si de ce fura. nu e normal sa bazezi un top al blogurilor, top care incepe sa devina relevant tocmai datorita blogurilor, pe norocul de a fi intr-o anumita zi, la o anumita ora, intr-o anumita pozitie.
    succese majore va urez.

  3. catalin Says:

    @ Dan Selaru

    Daca il stergi nu obtii nimic pentru blogul tau. Daca dai punctaje altora, asta nu inseamna ca pierzi ceva.

    Daca iti vei face 30 de bloguri care nu au punctaje din afara vei avea o retea foarte inchisa care nu va da foarte mult punctaj blogului pe care vrei sa il promovezi. Mai mult, sunt acolo niste mecaniste impotriva tipului acesta de spam de care probabil nu vei trece asa usor.

    Comentariile sunt irelevante in calcularea topului, de ele se tine cont doar in calcularea celor mai importante pozitii. Fireste, daca in ziua respectiva tu ai un post cu 100 de comentarii, si nu comentezi la cineva care ar avea 99 de comentarii, atunci ai fii in fata lui. Idem cu citarea.

    Iti propun sa il bati pe zoso. Daca reusesti personal iti voi oferi 3 sticle de wiskey (ce vrei tu, inclusiv branduri superpremium). Algortimul e suficient de solid ca sa reziste atacurilor.

    Cat priveste ideea de mafie, intrebarea este de ce am face-o. Si in plus poti sa delimitezi un grup clar care a ajuns acolo fara sa aiba merite (sa fi muncit mult, sa aiba un trafic corelat etc)?

  4. catalin Says:

    @ Arhi

    1. Analogia este simpla:
    Daca un om are o avere de 100000 de euro si 4 copii, iar altul are 80000 de euro si 2 copii, care dintre ei va da mai multi bani copiilor sai (fiecaruia in parte)?

    Sau, ca sa revenim la internet: Daca am o pagina cu 1000 de vizitatori care contine 100 de linkuri, si o pagina cu 500 de vizitatori care contine 2 linkuri, cum crezi ca se vor distribui vizitele inspre linkurile continute.

    Si as putea sa mai dau exemple de tipul asta o mie

    Este exact modelul pe care il adopta si Google in calcularea relevantei (numarul de linkuri ponderat cu relevanta acestora – calculata si in functie de graful linkurilor). Daca tipul asta de algoritm este irelevant, poate ar trebui sa le scrii si lor sa se inchida. Sau sa le furnizezi o metoda mai buna de structurare a rezultatelor. Caz in care dam si noi o lada bere pentru idee.

    De ce il mai tinem: pentru ca la fiecare nemultumit sunt cel putin 50 de multumiti (o dovedesc cei peste 800 de oameni care si-au pus widgetul pe blogul lor).

    Cred ca mai degraba as putea sa intreb eu: daca Zelist este irelevant, de ce nu ceri tu sa fii scos din el? De ce nu iei decizia sa refuzi sa girezi o chestie pe care o crezi nerelevanta?

    2. Cred ca trebuie facuta o distinctie intre “totalmente gresit” si “poate fi imbunatatit”. Totalmente gresit ar fi daca in fiecare saptamana ai vedea niste rezultate absolut aleatorii (si cu variatie mare) in top. Eu nu cred ca este cazul. Sigur, clasificarea poate fi imbunatatita, insa aceste imbunatatiri nu exclud (nici nu diminueaza) vocalizele. Din contra, pe masura ce Zelist va fi din ce in ce mai adoptat, vocalizele unora sau altora vor creste in intensitate. Asa merg lucrurile, vorba cuiva πŸ™‚

    c. A. Nu ai explicat de ce se fura. Furtul, daca e sa o luam in mod logic, presupune:
    – o actiune din partea celui care este acuzat de furt. Care este aceasta?
    – o intentie / un motiv. Care este acesta?
    – o persoana de la care se fura. Te simti furat? Sau exista altcineva care a fost furat, iar tu esti cavalerul in armura alba?

    In principiu astea trei ar trebui sa se dovedeasca concomitent, insa de dragul demostratiei, mi-ar placea sa imi dai doar una.

    B. Nu ai explicat de ce se greseste grav. Tot ce ai facut a fost sa faci niste observatii la care eu ti-am raspuns. Sunt convins ca lucrurile pot fi intotdeauna imbunatatite. Sunt de asemenea convins ca algoritmul este mai mult decat satisfacator in versiunea aceasta.

    In ceea ce priveste afirmatia “topul devine relevant datorita blogurilor” cred ca ar trebui sa facem o distinctie: Topul exista pentru ca exista bloguri (si ca lumea interactioneaza cu blogurile prin comentarii, linkuri etc). Este insa relevant si datorita faptului ca ne-am muncit la algoritm (nu am pus blogurile placinta, am agregat date la greu – facem acum 1 milion de posturi, nu am tinut partea nimanui).

  5. Arhi Says:

    Catalin, daca omul ala al tau din analogie e asa de bazat, de c enu e pe primul loc. Intelege ca acest CLASAMET e irelevant, atata timp cat locul 1 este mai putin relevant decat locul 4. E atat de simplu. Daca chirila, care fie vorba intre noi, are link pe prima pagina la realitatea.net, care nu e blog, deci daca chirila e atat de bun, sa fie pe primul loc, doar ofera cel mai mare punctaj, nu? in fine, e normal sa iti aperi munca, asa cum e normal ca eu sa ti-o critic, fiind slaba. Nu ma refer la furtul TAU, poate expresia nu e cea mai fericita, ci la pierderea linkurilor. Tu poti sa imi explici cu ce algoritmi vrei tu, atata timp cat tu parsezi doar indexurile la o data fixa, este incorect. eu pot sa am la chirila link in fiecare zi, daca in ziua in care parsati voi nu am si nu mai sunt pe prima pagina, la revedere, nu mai exista, nu primesc nimic, nu am fost linkuit. c’mon, e o prostie sa incerci sa ma convingi ca e corect.

  6. catalin Says:

    Arhi, intrebarea cu de ce nu e pe primul loc este la misto?

    Ma tem ca nu ai inteles cum functioneaza: daca ajungi la Bucuresti o data si chiar vrei sa intelegi cum e cu grafurile astea, dai o bere si iti explic. Sau mai simplu, daca ai timp, poti citi astea 2:

    http://en.wikipedia.org/wiki/Eigenvector
    http://en.wikipedia.org/wiki/PageRank

    Ce e atat de greu de priceput ca probabilitatea de a ajunge din punctul A in punctul B este mai mica daca exista mai multe cai care preaca din punctul A (catre B, C, D etc πŸ™‚

    Cat priveste linkul lui Chirila pe Realitatea, poti sta linistit, noi nu il luam in calcul. Astea sunt linkurile:
    http://www.zelist.ro/bloguri/tudorchirila.blogspot.com

    Cat priveste faza cu chirila care da mult si ar trebui sa fie pe locul intai, iar ma vad nevoit sa iti spun ca nu intelegi. Scorurile se calculeaza pe ce primeste un blog, nu pe ce da.

    Iti multumesc ca iti dai seama ca esti intr-o eroare cand clamezi furtul, sunt convins ca cu putine explicatii (sau mai multe) o sa intelegi incet incet si celelalte afirmatii.

    Inca o data, repet: daca e atat de slab si irelevant topul asta, de ce nu spui “Scoateti-ma frate din idiotenia asta?” :)) A nu se intelege ca vrem sa pleci: absolut fiecare blog conteza, dupa noi, pentru a crea o imagine a opiniei publice.

  7. Arhi Says:

    nu, nu cred ca e o idiotenie, cred ca trebuie cautata o alta modalitate relevanta. aceasta e fundamental gresita. pot accepta restul graphurilor si ce mai matematicesti tu acolo, dar faza ca un blog are relevanta doar daca intamplarea face ca intr-o anumita zi, la o anumita ora, linkul sau sa fie intr-un anume loc nu e acceptabila. Logic ar trebui ca zelist sa parseze toate posturile din ultima saptamana. asta e relevanta reala a blogurilor, nu ce gaseste pe index marti si miercuri. dar ma bucur ca esti calm si nu incepi cu atitudinile inteligente ale celorlalti “antreprenori” romani πŸ™‚

  8. catalin Says:

    Ma bucur ca nu crezi, Arhi. Eu as spune ca aceasta modalitate poate fi imbunatatita. Adica: daca am lua si linkurile din toate posturile din respectiva saptamana variatia rezultatelor ar fi cu maxim 10%. Asta pentru ca peste 95% din bloggeri nu scriu mai mult de 10 posturi pe saptamna (ceea ce insemana ca toate posturile lor sunt luate in considerare – daca au 10 posturi pe prima pagina).

    Daca vrei facem si pariu pe chestia asta.

    Cred ca aici nu e vorba nici de atitudini, nici de fitze si nici de alte chestii de genul asta. Eu imi apar produsul pentru ca merge bine (sigur, poate fi imbunatatit), tu incerci sa intelegi cum functioneaza si vii cu niste prouneri.

    Repet ca sa fie clar ca nu cedez nimic: Zelist este relevant, in viziunea mea. Iar ceea ce spui tu cu intamplarea e incorect pentru ca nu e vorba de un moment ci de toata saptamana pentru 95% din bloguri. O sa facem o modificare sa luam si posturile care s-au dus le a doua pagina la cei mai prolifici – asta nu va modfica rezultatele substantial, sunt foarte convins.

  9. Arhi Says:

    catalin, la zoso si la mine de exemplu, sunt aproape 10 posturi PE ZI. si sunt destul de multi care sunt asa.

  10. catalin Says:

    Arhi, multi nu sunt care au mai mult de 10 pe zi. Daca vrei facem si un pariu ca nu sunt mai mult de 20-30. Stiu ca la un moment dat am generat o statistica si erau vreo 70 care avea mai mult de 50 de posturi pe LUNA.

    Ideea este ca putem imbunatati algoritmul luand in calcul si tipul asta de situatii, mai ales ca in general cei care stiu mult sunt si bine pozitionati (deci acorda mai mult punctaj).

    Vom implementa si numaratoarea asta. Probabil in 2 saptamani. Eu sunt convins ca nu va afecta rezultatele major, dar chiar daca va afecta nu vad nici o problema in asta. Daca vrei punem un pariu: eu sustin ca media variatiei este de sub 7% pe primele 1000 de bloguri.

    Multumit?

  11. Blegoo Says:

    Catalin:
    Asa, mai pe intelesul blegilor: conteaza cate posturi sunt publicate pe saptamana, ori doar cate se vad pe prima pagina marti?

  12. catalin Says:

    Blegoo, acum conteaza ce e marti pe homepage (care pentru 99% din bloguri include toate posturile din saptamana). Vom modifica sa luam in considerare si posturile din respectiva saptamana care s-au dus pe prima pagina.

    Daca o facem saptamana viitoare, imbunatatirea asta de algoritm va aparea la topul de peste 2 saptamani. Totusi estimarile mele ochiometrice spun ca nu se va modfica major ordinea in clasament. (Desi ar fi bine daca s-ar mai modifica un pic – un pic de dinamism nu strica, si sincer mi-ar placea sa avem un algoritm care sa dea rezultate si mai bune decat acum).

    Sper ca am fost clar si nu am aburit pe nimeni πŸ™‚

    PS Misto filmuletzul.

  13. Blegoo Says:

    si inca o chestie, care mi se pare interesanta: vad pe prima pagina la zelist ceva cu titlul :Cele mai comentate bloguri”, unde zoso e pe locul 2 iar dono pe locul 5.
    Din nou, intreb si eu ca prostu’: asta se calculeaza doar ce e in fiecare marti, pe prima pagina, pe un anume blog?
    Incerc sa inteleg daca este ze[tuesday]list in general, ori doar ici-colo.
    Multumesc pt. atentie.

  14. Blegoo Says:

    Multzumesc de filmuletz. Am intrebat cu sinceritate, avand intentii rauvoitoare, evident.
    Evident, ideea mea era sa pregatesc foo 4-600 de articole, sa le dau pe toate la publicat marti la primul minut, si sa setez wordpresu’ sa le afiseze pe toate pe pagina de start. Cum poti contracara o astfel de miscare?
    (nu baga in seama ce-am zis de “ze[tuesday]list”, ai raspuns deja.)
    Referitor la “Cele mai comentate” insa, ma intreb ce ma impiedica sa procedez la fel – spre exemplu, indemnand-o pe R.R (roxanaradu.ro) sa republice postul ei la care are peste 500 de comentarii, martea care vine?
    Oare cum se reflecta asa ceva in clasamentul zelist?

  15. R.R Says:

    dap vreu si eu sa aflu, sincer …

    si inca ceva – am avut rabdarea sa ma uit pe clasament pana la 300 … cum se face ca acelasi blog l-am intalnit de mai multe ori pana la 300 … adica poti ocupa si locu 3 si locu 34 si locu 234?

  16. catalin Says:

    Nu, alea se numara prin insumarea comentariilor tuturor posturilor publicate pe un blog in ultima luna.

    Cam in toate partile se folosesc RSS-urile de commenturi, cu exceptia topului principal unde se foloseste parsarea directa a primei pagini din motive de blogroll (adica blogrolul nu apre in vreun RSS ci direct in HTML-ul respectiv).

    Si, daca e sa o luam foarte riguros, chiar si acolo nu este ZeTuesdayList decat pentru un numar foarte mic de oameni (cei care scriu mai mult de 10 posturi in ziua anteriora – luni). Probabil e vorba de maxim 10-15 oameni in ipoteza asta (cel mult). Este ZeIncompleteWeeklyPostsList pentru cei care intre doua luni consecutive au postat mai mult de zece posturi (cate incap pe prima pagina by default). Astia sunt probabil vreo 30-50 (pot spune cu exactitate luni, daca doresti)
    Si este ZeCompleteList pentru cei 99% care baga mai putin de 10 posturi pe saptamana.

    Referitor la ultimul comment: Nu cred ca e foarte eficient. De fapt nu e de loc eficient. Decat daca le publici pe 400 de bloguri diferite (din cele care sunt cel putin marginal linkate din afara, adica nu din interiorul retelei de 400.
    Daca le publici doar pe un blog nu afecteaza cu nimic topul principal (cel de aici – http://www.zelist.ro/bloguri)

    Si nici nu ai aparea pe prima pagina la Ze Bestest pe bloguri.

    Referitor la republicare – asta nu ar afecta cu nimic topul principal (repet ala e pe linkuri care iti vin din alte bloguri, ci ipotetic ar putea sa aiba impact doar in zona Zebestest de pe prima pagina). Faza este insa ca noi luam comentariile din RSS-ul de comentarii pe masura ce vin – adica ar trebui sa republici postul si apoi republici comentariu cu comentariu :)) Dar chiar ar trebui sa fie comentarii distincte (nu ai putea sa te apuci sa dai cut and paste la acelasi text).

    Deci pana la urma ar cam fi destul de greu de falsificat (s-ar merita doar dacs ZeList ar avea un trafic enorm pe prima pagina – peste 50000 pe zi – si atunci ar putea avea o noima sa te apuci sa scrii un post si sa incepi sa bagi 100 de comentarii distincte pe care noi sa le consideram non-spammy – adica sa simulteze activitatea umana)

    —–
    Sper sa fie destul de clar (sa nu se considere ca scriu prea mult ca sa aburesc pe cineva). Daca insa vrei in raspunsuri monosilabice avem atunci:

    1. Nu, topul celor mai comentate bloguri tine cont de posturile publicate oricand in ultima luna.
    2. Nu are nici un efect asupra topului principal si nici a zonei unde apar cele mai comentate
    3. Republicare nu face ca articolul respectiv sa apara in Zona de ZeBestest si nu are nici un efect asupra clasamentului.

    Alte intrebari? πŸ™‚

  17. catalin Says:

    Buna, Roxana

    Am raspuns prin comentariul de mai sus la intrebarea cu republicarea. Pe scurt: o republicare nu schimba cu nimic datele din Zelist.

    Referitor la duplicare, poti sa imi dai un exemplu concret (in top, pe pozitie X si Y apare acelasi blog)? Eu m-am uitat chiar acum si nu am vazut genul acesta de situatie (si nici nu ar trebui sa existe).

  18. R.R Says:

    Catalin,

    Ar trebui sa iau din nou la rand 300 de bloguri si timpul nu imi permite. Dar am deschis in alt tab (cate 10 tabu-uri deodata sa zic) cate un blog si da am dat peste acelasi de mai multe ori. Sincer …

  19. catalin Says:

    Roxana, le-am luat eu la rand si nu am gasit nici un duplicat. Este posibil sa fi vazut bloguri cu aceasi tema de wordpress, alta explicatie nu am.
    Daca ajungi vreodata sa vezi acelasi link de blog pe 2 pozitii (ceea ce nu prea are cum sa fie, din structura bazei de date) da-mi un semn. Dar repet, pur si simplu nu are cum sa fie exact acelasi link.

  20. R.R Says:

    Acuma le+am luat si eu la rand si nu mai sunt … da promit ca dau de stire data viitoare. Cu dovezi, ca sa nu par nebuna ca acuma. Multumesc

  21. catalin Says:

    Pe bune ca nu am schimbat nimic. Daca nu esti convinsa poti sa te uiti si in cache la Google pentru paginile respective.

  22. Zelist Blog » Blog Archive » Multumiri Says:

    […] comunicat cum trebuie etc. De exemplu puteti citi aici o discutie foarte interesanta. Sau aici. Sau aici. Pe baza tuturor explicatiilor date vom face si o sectiune de intrebari&raspunsuri mai […]

  23. Blegoo » Zelist… din nou Says:

    […] 2) Zeboboru’ aplauda, ud de placere, criza sub control, desi ZeZoso are rezervatii. 3) O persoana, sa zic, observa ceva ciudat in zelistul care este. 4) Nefiind dovezi si alea, galagia se inchide […]

  24. theamelie Says:

    Salut,
    mi-am facut un blog de putina vreme, din joaca. Povesti. Cred ca faine, oamenii citesc. Din ce in ce mai mult si mai multi. Cineva mi-a recomandat sa il inscriu in zelist. Doar ca nu am gasit indicatii si pana mai fac ceva research, poate ma ajutati si voi. As aprecia! πŸ™‚
    pana atunci: http://www.theamelie.wordpress.com
    merci !

  25. Domnu Nedelcu Says:

    De obicei nu dau comment-uri pe bloguri dar postul tau m-a fortat sa o fac. Felicitari pentru site!

  26. mercu Says:

    De ce luati in calcul “Site-uri ce linkeaza catre : X”, adica topul acela nu ar trebui sa fie in functie de trafic, vizite, vizitatori unici ? Daca sa zicem nici un site nu linkeaza spre mine, dar eu sunt citit de 5000 de oameni in fiecare zi care nu au blog pe ce loc ma voi situa ? Cat de sus sau jos ? Tind sa cred ca foarte jos si nu mi se pare prea corect. Astept raspuns. Multumesc.

  27. cristi Says:

    @ Theamelie,

    Salut, pentru a adauga un blog in ZeList intra in ZeTop si alege optiunea ,,Adauga un blog” din partea de sus a topului. Am adaugat blogul tau chiar acum si vei aparea in top-ul ZeList joi. Multumim pentru interesul acordat si nu ezita sa ne contactezi daca ai alte intrebari.

  28. t.s. Says:

    salut

    am o nelamurire: blogul meu a cazut de pe 700 pe 5400 in zelist, in decurs de 1 sapt [desi am fost f activ intre timp etc]. din cate observ, pe zelist s’a “sters” toata activitatea blogului din ultimele saptamani [?].

    apreciez mult topul vostru si sper ca e posibila o rezolvare a problemei [sau cel putin o explicatie – aici sau pe mail].

    merci.