- Home
- Blogs
Blogs
Jak usunąć z Google
- By Marek Inferior
- Published 02/29/2008
Jak usunąć swoją treść z indeksu Google?
Skoro
wiemy duzo o indexowaniu, warto wiedzieć o usuwaniu!
Jeśli chcesz usunąć treść z indeksu Google, a Twoje żądanie nie jest pilne, przeczytaj temat Jak zapobiegać indeksowaniu treści lub usunąć treść z indeksu Google? Znajdują się tam szczegółowe informacje na ten temat.
Jeśli jednak chcesz pilnie usunąć treść z indeksu Google i nie możesz czekać do następnego indeksowania, możesz przyspieszyć ten proces, używając narzędzia żądania usuwania adresu URL w zestawie narzędzi Google dla webmasterów. Proces ten trwa zwykle 3-5 dni roboczych.
Treści usunięte przy użyciu tego narzędzia zostaną wykluczone z indeksu Google na co najmniej 90 dni, niezależnie od tego, czy w tym czasie będą dostępne dla naszego robota. Pomyślnie żądania usunięcia treści w usłudze SafeSearch zostaną trwale wyłączone z wyników Google SafeSearch.
- Zaloguj się na konto narzędzi Google dla webmasterów przy użyciu konta Google.
- Kliknij adres URL żądanej witryny.
- Kliknij pozycję Narzędzia, a następnie kliknij przyciskUsuń adresy URL.
- Jeśli chcesz usunąć stronę lub grafikę, wykonaj jedną z poniższych czynności:
- Upewnij się, że żądania wyświetlenia strony powodują zwrócenie kodu stanu 404 lub 410 protokołu HTTP.
- Upewnij się, że strony, które chcesz usunąć, zostały zablokowane przy użyciu pliku robots.txt. Aby usunąć witrynę lub cały katalog, musisz wybrać tę opcję.
- Upewnij się, że strony, które chcesz usunąć, zostały zablokowane przy użyciu metatagu noindex.
- Jeśli chcesz usunąć zawartość katalogu lub całą witrynę, upewnij się, że strony, które chcesz usunąć, zostały zablokowane przy użyciu pliku robots.txt. Zwrócenie kodu stanu 404 nie wystarcza, ponieważ kod stanu 404 może zostać zwrócony przez katalog przy nieprzerwanym wyświetlaniu plików. Użycie pliku robots.txt do zablokowania katalogu gwarantuje wyłączenie również jego podkatalogów.
- Jeśli chcesz usunąć kopię strony zapisaną w pamięci podręcznej, musisz dodać do niej metatag noarchive albo zmienić jej treść. Ogólnie metatag noarchive służy do trwałego usunięcia treści z pamięci podręcznej, a zmiana treści strony umożliwia usunięcie jej z pamięci podręcznej tylko na pewien czas, aż do jej ponownego uruchomienia przez robota i zaktualizowania treści w pamięci podręcznej.
- Jeśli chcesz usunąć stronę lub grafikę, wykonaj jedną z poniższych czynności:
- Kliknij pozycję Nowe żądanie usunięcia i postępuj zgodnie z instrukcjami.
Uwaga: Korzystając z tego narzędzia, można w dowolnej chwili ponownie uwzględnić treść w okresie 90 dni.
robots.txt
- By Marek Inferior
- Published 02/29/2008
Jak kontrolować dostęp do witryny przy użyciu pliku robots.txt?
Plik robots.txt umożliwia blokowanie robotów wyszukiwarek przemierzających sieć. Zanim roboty pobiorą strony witryny, sprawdzają, czy w witrynie jest plik robots.txt i czy blokuje on im dostęp do niektórych stron.
Plik robots.txt jest potrzebny tylko w przypadku, gdy witryna zawiera treść, której wyszukiwarki nie mają indeksować. Jeśli wyszukiwarki mają indeksować całą witrynę, plik robots.txt jest całkowicie zbędny (nawet pusty).
Gdzie umieścić plik robots.txt?
Plik robots.txt musi znajdować się w katalogu głównym domeny i mieć nazwę ,,robots.txt". Plik robots.txt znajdujący się w podkatalogu jest ignorowany, ponieważ roboty szukają go jedynie w katalogu głównym domeny. Lokalizacja http://www.example.com/robots.txt jest zatem prawidłowa. Ale http://www.example.com/mysite/robots.txt już nie. Jeśli nie masz dostępu do katalogu głównego domeny, możesz blokować dostęp do stron za pomocą tagu META robots.
Jak utworzyć plik robots.txt?
Plik ten można utworzyć w każdym edytorze tekstów. Musi to być plik tekstowy o kodowaniu ASCII. Nie może to być plik HTML. Nazwa pliku nie może zawierać wielkich liter.
Składnia
W najprostszym pliku robots.txt stosowane są dwie reguły:
- User-agent: określa robota, którego dotyczy dana reguła
- Disallow: blokowane strony
Te dwa wiersze stanowią jeden wpis pliku. Plik może zawierać dowolną liczbę wpisów. W jednym wpisie można podać wiele wierszy Disallow i wiele wierszy User-agent.
Jaką treść musi mieć wiersz User-agent?
Wiersz User-agent określa robota wyszukiwarki. Baza danych robotów sieciowych
zawiera nazwy wielu robotów. Aby zastosować wpis do konkretnego robota,
należy podać jego nazwę. Aby zastosować go do wszystkich robotów,
należy zamiast nazwy wpisać gwiazdkę. Wpis dotyczący wszystkich robotów
wygląda następująco:
User-Agent: *
Google używa kilka robotów (user-agents). Robot indeksujący naszej wyszukiwarki sieciowej to Googlebot. Inne nasze roboty, takie jak Googlebot-Mobile i Googlebot-Image, stosują się do reguł dotyczących narzędzia Googlebot, ale można również utworzyć dla nich oddzielne, dodatkowe reguły.
Jaką treść musi mieć wiersz Disallow?
Wiersz Disallow zawiera listę blokowanych stron. Można określić
konkretny adres URL lub wzorzec. Wpis musi się zaczynać od ukośnika (/).
- Aby zablokować całą witrynę, należy użyć ukośnika.
Disallow: /
- Aby zablokować katalog i całą jego zawartość, po nazwie katalogu należy wpisać ukośnik.
Disallow: /katalog_prywatny/
- Aby zablokować stronę, należy wpisać jej nazwę.
Disallow: /plik_prywatny.html
W adresach URL uwzględniana jest wielkość znaków. Na przykład wpis Disallow: /private_file.html blokuje http://www.example.com/private_file.html, ale dopuszcza http://www.example.com/Private_File.html.
Jak zablokować Googlebota?
Blokowanie Googlebota
Google używa kilku agentów użytkownika (user-agents). Każdemu z nich
można zablokować dostęp, podając nazwę bota w wierszu User-agent wpisu.
Wskutek zablokowania Googlebota zablokowane zostaną wszystkie roboty,
których nazwa zaczyna się od Googlebot.
- Googlebot: przemierza strony uwzględniane w indeksie witryn internetowych oraz Google News
- Googlebot-Mobile: przemierza strony uwzględniane w indeksie witryn komórkowych
- Googlebot-Image: przemierza strony uwzględniane w indeksie grafiki
- Mediapartners-Google: przemierza strony w celu ustalenia treści AdSense. Ten robot jest używany tylko do przemierzania witryn, w których wyświetlane są reklamy AdSense.
- Adsbot-Google: przemierza strony w celu oceny jakości strony docelowej AdWords. Ten robot jest stosowany tylko do przemierzania witryn reklamowanych w programie Google AdWords. Dodatkowe informacje o tym robocie i sposobach blokowania mu dostępu do części witryny.
Aby całkowicie zablokować Googlebota, można użyć następującej składni:
User-agent: Googlebot
Disallow: /
Zezwalanie Googlebotowi na dostęp
Aby zablokować dostęp wszystkim robotom oprócz Googlebota, można użyć następującej składni:
User-agent: *
Disallow: /
User-agent: Googlebot
Disallow:
Googlebot wykonuje instrukcje z wiersza skierowanego do niego, a nie z wiersza skierowanego do wszystkich robotów.
Rozszerzenie Allow
Googlebot rozpoznaje rozszerzenie standardu robots.txt zwane Allow.
Rozszerzenie to nie jest rozpoznawane przez niektóre inne roboty
wyszukiwarek. Wiersz Allow działa w taki sam sposób jak wiersz
Disallow. Należy po prostu podać katalog lub stronę, do której ma być
umożliwiony dostęp.
Wierszy Disallow i Allow można używać łącznie. Na przykład aby zablokować dostęp do wszystkich stron w podkatalogu oprócz jednej, należy podać następujące wpisy:
User-agent: Googlebot
Disallow: /folder1/
Allow: /folder1/mojplik.html
Wpisy te zablokują dostęp do wszystkich stron znajdujących się w katalogu folder1 oprócz pliku mojplik.html.
W celu zablokowania Googlebota i umożliwienia dostępu innym robotom Google (takim jak Googlebot-Mobile) można posłużyć się regułą Allow. Na przykład:
User-agent: Googlebot
Disallow: /
User-agent: Googlebot-Mobile
Allow: /
Blokowanie lub usuwanie stron przy użyciu pliku robots.txt.
Aby uniemożliwić Googlebotowi przemierzanie stron witryny, należy użyć pliku robots.txt. Jeśli nie chcesz tworzyć pliku robots.txt od podstaw, możesz skorzystać z narzędzia generującego pliki robots.txt , aby szybko i sprawnie utworzyć plik robots.txt, który można następnie zapisać na serwerze.
W przypadku ręcznego generowania pliku robots.txt, aby na przykład uniemożliwić Googlebotowi przemierzanie wszystkich stron w określonym katalogu (np. lemury), można użyć następującego wpisu w pliku robots.txt:
User-agent: Googlebot
Disallow: /lemury
Aby uniemożliwić Googlebotowi przemierzanie wszystkich plików określonego typu (na przykład w formacie .gif), można użyć następującego wpisu w pliku robots.txt:
User-agent: Googlebot
Disallow: /*.gif$
Aby uniemożliwić Googlebotowi przeszukiwanie adresów URL zawierających znak ? (a konkretnie, jakikolwiek adres URL zaczynający się od nazwy domeny, po której następuje dowolny ciąg, a za nim znak zapytania oraz następny dowolny ciąg):
User-agent: Googlebot
Disallow: /*?
Nie będziemy przeszukiwać ani indeksować treści stron zablokowanych w pliku robots.txt, ale możemy przeszukiwać i indeksować te adresy URL znalezione na innych stronach w sieci. W związku z tym adres URL takiej strony oraz prawdopodobnie również inne powszechnie dostępne informacje, np. teksty linków do witryny lub tytuł z Open Directory Project (www.dmoz.org), zostaną wyświetlone w wynikach wyszukiwania Google. Treść strony nie będzie jednak przemierzana, indeksowana ani wyświetlana.
Aby całkowicie uniemożliwić dodanie strony do indeksu Google, nawet jeśli prowadzą do niej linki z innych witryn, należy użyć metatagu noindex i sprawdzić, czy strona nie jest umieszczona w pliku robots.txt. W trakcie indeksowania strony Googlebot odczyta metatag noindex i usunie adres URL z indeksu.
Kontrola_meta
- By Marek Inferior
- Published 02/29/2008
Blokowanie lub usuwanie stron przy użyciu metatagów.
Zamiast używać pliku robots.txt do zapobiegania indeksowaniu stron, możesz umieścić na stronie HTML tag <META> informujący roboty, że tej strony nie powinny indeksować. Standard ten opisano na stronie http://www.robotstxt.org/wc/exclusion.html#meta (dostępnej w języku angielskim).
Aby zapobiec indeksowaniu strony z witryny przez wszystkie roboty, można umieścić na tej stronie następujący metatag w sekcji <HEAD>:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Aby umożliwić innym robotom indeksowanie strony z witryny, a uniemożliwić to tylko robotom Google, możesz użyć następującego tagu:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
Aby umożliwić robotom indeksowanie strony z witryny, ale uniemożliwić im korzystanie z linków do witryn zewnętrznych, możesz użyć następującego tagu:
<META NAME="ROBOTS" CONTENT="NOFOLLOW">
Aby umożliwić robotom indeksowanie strony z witryny, ale uniemożliwić im indeksowanie umieszczonych na niej grafik, możesz użyć następującego tagu:
<META NAME="ROBOTS" CONTENT="NOIMAGEINDEX">
Indexacja w google
- By Marek Inferior
- Published 02/29/2008
W wynikach wyszukiwania nie widać mojej witryny lub zajmuje ona niższą pozycję niż dotychczas
-
Google radzi:
Naszym celem jest zwracanie trafnych wyników wyszukiwania każdego zapytania. Wyniki wyszukiwania pochodzą z naszego indeksu. Z kolei nasz indeks stale ewoluuje, w miarę jak zmienia się zawartość internetu. Zmiany te, a także aktualizacje naszych algorytmów obliczających pozycje stron w rankingu mogą prowadzić do zmiany położenia poszczególnych adresów URL w wynikach wyszukiwania, a nawet - choć jest to mniej prawdopodobne - do ich usunięcia.
Rozumiemy, że zmiany te mogą powodować zamieszanie. Jeżeli jednak witryna jest dobrze połączona linkami z innymi witrynami w sieci, prawdopodobnie dodamy ją znowu podczas kolejnego indeksowania sieci. Nie możemy zagwarantować stałego miejsca witryny w indeksie ani jej rankingu w wynikach wyszukiwania, ale oferujemy Wskazówki dla webmasterów, dzięki którym można ułatwić pracę robotom. Stosując się do tych zaleceń, można zwiększyć prawdopodobieństwo systematycznego uwzględniania witryny w naszych wynikach wyszukiwania.
Jeśli dana witryna nie pojawia się w wynikach wyszukiwania Google lub zajmuje niższą pozycję niż dawniej, wykonaj poniższe czynności, aby zidentyfikować potencjalne przyczyny problemu i rozwiązać go.
1. Sprawdź, czy witryna znajduje się w indeksie Google.2. Sprawdź, czy Google może znaleźć i przemierzać Twoją witrynę.
3. Sprawdź, czy Google może zaindeksować witrynę.
4. Upewnij się, że treść witryny jest przydatna i trafna.
1. Sprawdź, czy witryna znajduje się w indeksie Google.
- Przeprowadź wyszukiwanie z użyciem operatora site:.
Kiedy webmasterzy informują nas, że ich witryna nie jest uwzględniana w wynikach wyszukiwania, często okazuje się, że jednak jest inaczej. Aby szybko sprawdzić, czy witryna nadal znajduje się w naszym indeksie, wyszukaj w Google jej pełny adres URL. Na przykład wyszukiwanie site:www.google.pl da następujące wyniki: http://www.google.com/search?num=100&q=site:www.google.pl Pamiętaj, że między operatorem site: a nazwą domeny nie należy umieszczać spacji. Kreator stanu witryny umożliwia sprawdzenie stanu zindeksowania witryny i określenie, kiedy strona główna została ostatni raz odwiedzona przez Google.
Jeśli witryna jest wyświetlana w wynikach wyszukiwania adresu URL witryny w Google, to znaczy, że jest uwzględniona w indeksie.
Jeśli jednak strona była kiedyś zaindeksowana, ale już nie jest, możliwe, że została usunięta z powodu naruszenia Wskazówek dla webmasterów. Zapoznaj się z tymi wskazówkami, a następnie, po wprowadzeniu niezbędnych zmian, prześlij żądanie ponownego rozpatrzenia zgłoszenia.
- Sprawdź pozycję rankingową domeny, pod którą znajduje się Twoja witryna.
Wyszukaj w Google adres www.TwojaDomena.pl. Jeśli Twojej witryny nie będzie na liście wyników lub jeśli znajdzie się ona na dalekiej pozycji, będzie to oznaczało, że mogła na nią zostać nałożona kara za naruszenie wskazówek dla webmasterów. Gdy odkrywamy jakiś problem z daną witryną - na przykład, że rozsyła ona szkodliwe oprogramowanie, informujemy jej właściciela za pośrednictwem Centrum wiadomości. Sprawdź też, czy witryna jest zgodna ze wskazówkami dla webmasterów i prześlij prośbę o ponowne sprawdzenie witryny.
- Poinformuj nas o nowej zawartości witryny.
Jeśli Twoja witryna pojawiła się bardzo niedawno, możemy jeszcze o niej nie wiedzieć. Poinformuj Google o swojej witrynie. Jednym ze sposobów, aby przyspieszyć odkrycie przez Google nowych stron, jest przesłanie mapy witryny. Nawet jeśli witryna znajduje się już w indeksie Google, dzięki mapie witryny możesz poinformować nas, które strony są Twoim zdaniem najważniejsze.
2. Sprawdź, czy Google może znaleźć i przemierzać Twoją witrynę.
- Sprawdź, czy nie wystąpiły błędy przemierzania. Strona błędów przemierzania w Narzędziach dla webmasterów zawiera szczegółowe informacje na temat adresów URL witryny, które próbowaliśmy przemierzyć, ale nie mogliśmy uzyskać do nich dostępu. Przejrzyj listę błędów i popraw te, które możesz. Gdy narzędzie Googlebot będzie przemierzać witrynę kolejny raz, dostrzeże wprowadzone zmiany i zaktualizuje odpowiednio indeks Google.
- Przeanalizuj zawartość pliku robots.txt. Narzędzie Analizuj plik robots.txt umożliwia przeanalizowanie treści pliku robots.txt w celu sprawdzenia, czy nie blokuje on narzędziu Googlebot dostępu do pewnych adresów URL lub katalogów witryny.
- Sprawdź, czy niektóre adresy URL nie zostały zablokowane przy użyciu metatagów.
- Przeanalizuj strukturę witryny i upewnij się, że jest ona łatwo dostępna. Działanie większości wyszukiwarek jest oparte na tekście. Jeśli nawigacja lub linki tworzone są przy użyciu technologii JavaScript, DHTML, grafik lub animacji Flash, narzędzie Googlebot i inne roboty - pająki mogą mieć problemy z przemierzaniem witryny.
- Jeśli niedawno zmieniano strukturę witryny lub domenę, do której jest ona przypisana, strony, które dotychczas zajmowały wysokie pozycje w rankingu, mogą teraz wypadać słabo. Aby tego uniknąć, użyj przekierowań 301 (RedirectPermanent) w pliku .htaccess, w celu inteligentnego przekierowania użytkowników, narzędzia Googlebot i innych robotów - pająków na właściwe strony. (W przypadku serwera Apache służy do tego plik .htaccess, zaś na serwerze IIS można to zrobić przy użyciu konsoli administracyjnej). Więcej informacji na temat przekierowań HTTP 301 można znaleźć na stronie http://www.ietf.org/rfc/rfc2616.txt.
- Rozważ utworzenie i zgłoszenie mapy witryny. Nawet jeśli witryna jest już zaindeksowana, przy użyciu mapy witryny możesz przekazać nam dodatkowe informacje na jej temat i wskazać adresy URL, które są według Ciebie najważniejsze. Mapy witryn są szczególnie przydatne w przypadku witryn zawierających treść generowaną dynamicznie lub zawartość, której narzędzie Googlebot nie może łatwo wykryć, a także witryn nowych lub takich, do których prowadzi niewiele linków.
3. Sprawdź, czy Google może zaindeksować witrynę.
- Przejrzyj statystyki indeksowania witryny. Pokazują one, jak witryna jest przedstawiana w indeksie Google.
- Przeanalizuj strukturę witryny. Google, podobnie jak większość wyszukiwarek, opiera się na tekście. Oznacza to, że narzędzie Googlebot nie potrafi odczytywać tekstu umieszczonego w elementach graficznych ani w większości plików w technologii Flash. Tak samo jest w przypadku stron, do których dostęp możliwy jest jedynie poprzez JavaScript lub zalogowanie się. Zadbaj o to, aby treść witryny miała postać tekstową i łatwo było ją odczytać. W ten sposób zwiększysz jej dostępność dla użytkowników i dla narzędzia Googlebot.
4. Upewnij się, że treść witryny jest przydatna i trafna.
- Dowiedz się, jak użytkownicy trafiają do Twojej witryny na stronieNajczęstsze zapytania. Pierwsza lista zawiera zapytania Google, po których najczęściej pojawia się Twoja witryna. Druga lista zawiera zapytania, po których użytkownicy odwiedzili Twoją witrynę. Informacje te są wyjątkowo przydatne, ponieważ pokazują, czego użytkownicy szukają (pierwsza lista) i co przekonuje ich na tyle, że odwiedzają Twoją witrynę (druga lista). Twoja witryna może na przykład pojawiać się w wynikach Google po wpisaniu zapytań gadżety do espresso i urządzenia do kawy. Jeśli zapytania urządzenia do kawy nie ma na drugiej liście, możliwe, że dla użytkowników nie jest dostatecznie jasne, że Twoja witryna zawiera informacje na temat urządzeń do kawy. W takim przypadku rozważ modyfikację treści, aby była ona bardziej trafna i wciągająca. Unikaj jednak mnożenia w witrynie mnóstwa słów kluczowych, ponieważ może na tym ucierpieć jej pozycja w rankingu, a także komfort korzystania z niej.
- Dowiedz się, jak Google postrzega Twoją witrynę. Na stronie Co widzi Googlebot pokazywane są słowa kluczowe i wyrażenia, pod którymi w innych witrynach umieszczane są linki do Twojej witryny. Zrozumienie, jak inni postrzegają Twoją witrynę, pomoże Ci ustalić, jak najlepiej dotrzeć do grupy docelowej.
- Zapoznaj się z zawartością strony Analiza treści w Narzędziach dla webmasterów. Opisowe informacje umieszczane w tagach tytułowych i metatagach pozwalają nam zorientować się w zawartości witryny. Dodatkowo mogą one być wyświetlane na stronach wyników wyszukiwania, a przydatny opisowy tekst jest chętniej klikany przez użytkowników.
- Poinformuj świat o swojej witrynie. Linki prowadzące do Twojej witryny pomagają Google ustalić, na ile odpowiada ona oczekiwaniom użytkowników wykonujących określone zapytania. Naturalne linki do Twojej witryny powstają w sieci, gdy inne strony uznają treść Twojej witryny za przydatną dla ich odwiedzających.
Wskazówki dla webmasterów
- By Marek Inferior
- Published 02/29/2008
Wskazówki dla webmasterów od Google
Stosujac sie do ponizszych wskazówek, ulatwisz wyszukiwarce Google znalezienie, zaindeksowanie i pozycjonowanie witryny. Jezeli nawet nie zastosujesz sie do zadnej z ponizszych propozycji, zdecydowanie zalecamy uwazne przeczytanie Wskazówek jakosciowych. Opisalismy w nich niektóre niedozwolone dzialania, które moga doprowadzic do calkowitego usuniecia witryny z indeksu Google lub innych sankcji. Witryna objeta sankcjami moze nie byc juz wymieniana na liscie wyników wyszukiwania na stronie Google.pl ani w zadnej witrynie partnerskiej Google.
* Wskazówki techniczne, dotyczace wygladu i tresci
* Wytyczne jakosciowe
Gdy witryna jest juz gotowa:
* Postaraj sie, aby inne odpowiednie witryny zamieszczaly linki do Twojej witryny.
* Zglos ja w Google pod adresem http://www.google.com/addurl.html.
* Zglos mape witryny przy uzyciu narzedzi Google dla webmasterów. Mapa witryny umozliwia Google poznanie struktury witryny i szersze uwzglednienie jej stron.
* Sprawdz, czy wszystkie odpowiednie witryny zostaly poinformowane o tym, ze Twoja witryna jest dostepna w sieci.
* Zglos swoja witryne w odpowiednich katalogach, takich jak Open Directory Project i Yahoo!, a takze we wlasciwych witrynach branzowych.
Wskazówki dotyczace wygladu i tresci
* Utwórz witryne o przejrzystej hierarchii i linkach tekstowych. Kazda strona powinna byc dostepna po kliknieciu co najmniej jednego statycznego linku tekstowego.
* Udostepnij uzytkownikom mape witryny z linkami, które wskazuja wazne czesci witryny. Jezeli mapa witryny zawiera ponad 100 linków, warto podzielic ja na kilka oddzielnych stron.
* Utwórz witryne przydatna, zawierajaca wiele informacji. Jej strony powinny przedstawiac tresc przejrzyscie i dokladnie.
* Pomysl, jakie slowa wpisywaliby uzytkownicy, wyszukujac takie strony, i uwzglednij te slowa w witrynie.
* Do wyswietlania waznych nazw, elementów tresci i linków uzywaj raczej tekstu niz grafik. Robot Google nie rozpoznaje tekstu zawartego w grafikach.
* Tresc tagów TITLE i atrybutów ALT powinna byc opisowa i dokladna.
* Sprawdz, czy w witrynie wystepuja nieprawidlowe linki i w razie potrzeby popraw kod HTML.
* Jezeli zdecydujesz sie na uzywanie stron dynamicznych (tzn. ze znakiem zapytania w adresie URL), pamietaj, ze nie wszystkie roboty-pajaki wyszukiwarek przemierzaja strony zarówno dynamiczne, jak i statyczne. Dobrze jest stosowac jak najmniej parametrów i mozliwie najkrótszych.
* Poszczególne strony nie powinny zawierac wiecej niz 100 linków.
Wytyczne techniczne
* Do testowania witryny uzywaj przegladarki tekstowej takiej jak Lynx, poniewaz wiekszosc robotów-pajaków wyszukiwarek widzi witryny tak, jak Lynx. Jezeli zaawansowane funkcje, takie jak JavaScript, pliki cookie, identyfikatory sesji, ramki, kod DHTML lubFlash uniemozliwiaja wyswietlenie calej witryny w przegladarce tekstowej, roboty-pajaki moga miec problemy z jej zaindeksowaniem.
* Zezwól robotom wyszukiwarek na indeksowanie witryn bez identyfikatorów sesji lub argumentów sluzacych do sledzenia ich drogi w witrynie. Techniki te sa przydatne w sledzeniu zachowania poszczególnych uzytkowników, ale sposób dzialania robotów jest zupelnie inny. Korzystanie z tych technik moze doprowadzic do niepelnego zaindeksowania witryny, poniewaz roboty moga nie byc w stanie wyeliminowac adresów URL, które wygladaja inaczej, ale wskazuja w rzeczywistosci te sama strone.
* Serwer sieciowy powinien obslugiwac naglówek HTTP If-Modified-Since. Dzieki tej funkcji serwer moze poinformowac Google, czy tresc witryny zmienila sie od ostatniego jej zaindeksowania. W ten sposób zmniejszysz obciazenie lacza i zasobów.
* Umiesc plik robots.txt na serwerze sieciowym. Plik ten informuje roboty o dostepnych i niedostepnych dla nich katalogach. Zadbaj o aktualnosc tego pliku, aby nie powodowal niezamierzonego blokowania narzedzia Googlebot. Przejdz na strone http://www.robotstxt.org/wc/faq.html,aby nauczyc sie instruowac roboty odwiedzajace witryne. Plik robots.txt mozna przetestowac za pomoca narzedzia do analizy pliku robots.txt dostepnegow narzedziach Google dla webmasterów.
* Jezeli Twoja firma planuje kupic system zarzadzania trescia, sprawdz, czy system ten moze eksportowac tresc w taki sposób, aby roboty mogly zaindeksowac witryne.
* Za pomoca pliku robots.txt mozna zablokowac indeksowanie stron wyników wyszukiwania lub innych generowanych automatycznie stron, nieprzydatnych uzytkownikom przechodzacym do witryny z wyszukiwarek.
Wytyczne jakosciowe
Niniejsze wytyczne jakosciowe wskazuja najczestsze formy manipulacji i podstepów, ale Google moze takze reagowac negatywnie na inne, niewymienione tutaj oszukancze praktyki (na przyklad zwodzenie uzytkowników przez stosowanie nazw znanych witryn z literówkami). Nie nalezy zakladac, ze jesli na tej stronie nie opisano jakiejs podstepnej techniki,to Google ja akceptuje. Webmasterzy, którzy przestrzegaja podstawowych zasad, oferuja uzytkownikom lepsze witryny. Dzieki temu uzyskuja wyzsze pozycje w rankingu niz oszusci, którzy traca energie na wynajdywanie sztuczek.
Jezeli uwazasz, ze inna witryna nie spelnia jakosciowych wytycznych Google, zglos ja pod adresem https://www.google.com/webmasters/tools/spamreportóhl=pl. Google preferuje opracowywanie elastycznych i zautomatyzowanych rozwiazan problemów, dlatego tez staramy sie unikac bezposredniego zwalczania spamerów. Uzyskane powiadomienia o spamie wykorzystujemy do tworzenia elastycznych algorytmów, które rozpoznaja i blokuja kolejne próby spamowania.