My ordinary life

Viata vazuta prin ochelari cu dioptrii variabile

Mic indreptar pentru webmasteri

with 3 comments

Am scris postul initial prin 2006, si a avut mai mult de 24 000 de afisari.
Uitasem de el, pana zilele trecute, cand l-am gasit listat pe un blog, dar cu alt autor ;)

In lumina ultimelor dicutii, cred ca o rapida citirea a sa este binevenita.

Exista in aceste zile, pe acest foum, pe aceasta arie mica o mare involburare a mintii umane vrajita de efectul SEO.

SEO este o ceata densa si magica ce se ridica dintr-o mlastina imputita. Doar initiatii pot trai in aceste conditii. – cam asa percep cei mai multi oameni fenomenul SEO (Search Engine Optimization).

De la inceput va avertizez ca NU sunt un profesionist al acestui domeniu, ci doar un webmaster care a avut Softpedia ca teren de joaca in acest sens.

Respectand regulile de mai jos va asigur ca nu veti fi filtrati de motoarele de cautare.

Reguli de baza:

1. Continutul paginilor este cel care va promoveaza atat prin calitate, cat si prin cantitate.
De aici expresia Content is King ! Fara continut real (ma refer la partea vizibila, nu codul HTML) nici vizitatorii si nici motoarele de cautare nu vor fi multumiti de site-ul vostru.

2. NU folositi nici un fel de tehnici de pacalire a motoarelor de cautare de genul:

- cuvinte cheie mici in footer
- cuvinte cheie invizibile pe pagina
- doorway, care au functia de a arata motoarelor de cautare o fata mult mai friendly si deosebita decat le-ar arata-o vizitatorilor cu browsere clasice.
- pagini cu continut redundant sau partial redundant.
- nu creati pagini ce contin sute-mii de link-uri catre alte pagini de pe site-ul vostru.

Reguli ce tin de webdesign/html

- incarcati sa nu aveti pagini imense ca dimensiuni (Kb), sau daca o faceti, folositi modgzip.

- nu abuzati de elemente grafice

- nu abuzati de tehnologia Flash daca nu este cazul. Stim ca Google poate indexa unele site-uri Flash, insa nu e valabil si pt alte motoare de cautare si nici nu au rezultate excelente.

- chiar daca sunt elemente deja perisate incercati sa puneti pe fiecare pagina META Tags (Description & Keywords), dar nu au nici o valoare daca ai 1000 de pagini si toate au aceleasi taguri…
Ideal ar fi ca fiecare pagina sa aiba alte taguri, relevante pentru continut.

Nu abuzati de Keywords; va furati caciula !

- structural, urmand curgerea codului HTML este indicat ca elementele importante sa ajunga in partea de sus a codului.
ex:
Daca ai o pagina cu un tabel ce are 2 colane, una pe stanga ca bara de navigare si contentul in celula din dreapta, este bina sa NU abuzati de celula din stanga cu tot felul de prostii pentru ca veti impinge contentul si mai jos !

- daca folositi scripturi pentru crearea site-ului aveti grija sa aiba niste URL-uri citibile de motoarele de cautare, iar asta se face cel mai usor prin modrewrite. (vezi apache).
Feriti-va sa aveti in URL hash-uri, caractere ca &, ; , etc

- paginile ajuta daca au un nume de fisier relevant.
ex: Download-Winamp.html
Este preferata – sau + pentru despartirea cuvintelor, NU _ (underscore).
Explicatia este ca Underscore ( _ ) este considerat ca o alta litera, nu ca separator de cuvinte.

- elementele relevante din pagina trebuiesc subliniate vizual (BOLD, FONT-SIZE mare), insa NU o faceti din CSS ! Stiu ca e contra curentului actual de optimizare, insa motoarele de cautare nu interpreteaza si css-ul.

- acolo unde este posibil, fiecare imagine sa aiba ALT text completat, iar daca e nevoie chiar si TITLE (are aceeasi fct ca ALT, insa pt link-uri ordinare).

- nu folositi JS pentru deschiderea pop-up-urilor sau a imaginilor. Folositi link direct.

- fiecare pagina trebuie sa aiba un titlu diferit si relevant pentru continutul ei !

PR (Page Rank)

PR nu mai este ce a fost. E partea vizibila si tentanta a unui iceberg misterios.

Nu mai dati bani in nestire pentru cumpararea de link-uri pe site-uri cu PR mare.
Nu au nici un folos daca site-ul nu are aceeasi tematica cu voi.

ex. Daca Softpedia are link catre ea de pe Download.com, acest lucru va ajuta ff. mult Softpedia.
Daca Softpedia are link pe Ebay.com… Softpedia se va alege doar cu banii pierduti

Ideal ar fi sa ai link-uri unidirectionale dinspre site-uri de profil asemanator.
In acest fel pt motorul de cautare devii o autoritate in domeniul tau.
Ex. Softpedia are mii de link-uri de pe site-urile producatorilor de software.

In acest caz conteaza ff. mult si cantitatea… link-urilor.

Sitemaps

Aceasta facilitate este incredibila !

https://www.google.com/webmasters/sitemaps/

Din pacate doar prea putin stiu de ea si o folosesc cum ar trebui.

Google a dat posibilitatea webmasterului de a dresa Google Bot !

Creati si submiteti fisierele sitemap.xml ale site-ului vostru in contul de pe aria Webmaster Tools.

Modificati si tineti la zi acest fisier, fara a trisa !

=====================

Later edit (12.02.2009)

Ceea ce am scris mai sus ramane valabil, insa in decurs de 2 ani internetul a evoluat, iar regulile de buna conduita trebuie imbunatatite.

Orice lucru bun, daca este folosit excesiv… va crea probleme.
TAG-urile, folosite in mod corect, alese relevant pentru articol si de preferinta putine/articol, pot fi foarte utile.

Pe ideea tapita si simplista ca mai multe pagini indexate = devii mai important, multe site-uri abuzeaza de aceasta tehnologie pentru a crea pagini SPAM.
Pe termen scurt (6 luni) rezultatele pot fi incredibile, insa dupa un an efectele adverse apar si respectivul site scade in ranking… inexplicabil. smile.gif

O alta tehnica deja oarecum deprecated este sa NU generezi pagini false, bazate pe cautarile vizitatorilor.

Ex:
Eu caut pe x.com termenul “softpedia” => automat se creaza x.com/…/softpedia.html

Motoarele de cautare nu sunt inteligente, dar nici proaste!
Se adapteaza, iar abuzurile se pedepsesc; e de bun simt sa le eviti, pe cat este posibil, iar unele scapari pot fi reparate folosiind fisierul robots.txt.

Google are chiar un set extins de reguli, foarte folositor cand e aplicat.

Studiati http://forum.softpedia.com/robots.txt

Disallow: /admin.php*
Disallow: /index.php?act=Stats*
Disallow: /index.php?act=Members*
Disallow: /index.php?act=calendar*
Disallow: /index.php?act=Help*
Disallow: /index.php?showuser*
Disallow: /index.php?act=Profile*
Disallow: /index.php?act=Login*
…..
…..

Opriti accessul robotului la facilitatile neimportante din site; cele mai populare ar fi: send page to a friend, comment, print, report etc
Acestea sunt pagini bulk, care scad calitatea continutului indexat.

=====

Un articol foarte interesant despre Canonical Links puteti citi pe blogul lui Matt Cutts.

Written by Bogdan Gheorghe

February 16th, 2009 at 10:40 pm

Tagged with ,

3 Responses to 'Mic indreptar pentru webmasteri'

Subscribe to comments with RSS or TrackBack to 'Mic indreptar pentru webmasteri'.

  1. Nu merge link-ul “set extins de reguli” :(

    Florin

    8 May 09 at 23:13

  2. Florin

    8 May 09 at 23:20

  3. Din pacate pagina respectiva nu mai este, desi era extrem de folositoare.

    Ideea pleca de aici:

    http://googlewebmastercentral.blogspot.com/2008/06/improving-on-robots-exclusion-protocol.html

    Iata continutul ei din Google Cache:

    Pattern matching

    Yes, Googlebot interprets some pattern matching. This is an extension of the standard, so not all bots may follow it.

    Matching a sequence of characters using *
    You can use an asterisk (*) to match a sequence of characters. For instance, to block access to all subdirectories that begin with private, you could use the following entry:

    User-agent: Googlebot
    Disallow: /private*/

    To block access to all URLs that include a question mark (?), you could use the following entry:

    User-agent: *
    Disallow: /*?

    To block access to all URLs containing the word “private”, you could use:

    User-agent: *
    Disallow: /*private*

    Matching the end characters of the URL using $
    You can use the $ character to specify matching the end of the URL. For instance, to block an URLs that end with .asp, you could use the following entry:

    User-agent: Googlebot
    Disallow: /*.asp$

    You can use this pattern matching in combination with the Allow directive. For instance, if a ? indicates a session ID, you may want to exclude all URLs that contain them to ensure Googlebot doesn’t crawl duplicate pages. But URLs that end with a ? may be the version of the page that you do want included. For this situation, you can set your robots.txt file as follows:

    User-agent: *
    Allow: /*?$
    Disallow: /*?

    The Disallow:/ *? line will block any URL that includes a ? (more specifically, it will block any URL that begins with your domain name, followed by any string, followed by a question mark, followed by any string).

    The Allow: /*?$ line will allow any URL that ends in a ? (more specifically, it will allow any URL that begins with your domain name, followed by a string, followed by a ?, with no characters after the ?).

    Bogdan Gheorghe

    8 May 09 at 23:42

Leave a Reply