Minggu, 28 November 2010

Mengenal Google secara Mendalam ( Bagian 4)

03 // Manipulasi URL Google
> And bisa mengganti interface google dengan mengganti variabel hl
(default google hl=en => bahasa inggris)
Misalkan kita mengubah interface-nya menjadi bahasa Indonesia.
http://www.google.com/search?hl=en&lr=&q=site%3Aecho.or.id&btnG=Search
Hasil modifikasi URL
http://www.google.com/search?hl=id&lr=&q=site%3Aecho.or.id&btnG=Search
> Anda dapat mengganti hasil pencarian hanya pada bahasa tertentu. Hal ini dilakukan dengan modifikasi
variabel lr. (default google lr=lang_en => bahasa inggris)
Misalkan kita hasil pencarian hanya bahasa Indonesia.
http://www.google.com/search?hl=en&lr=&q=site%3Aecho.or.id&btnG=Search
Hasil modifikasi URL
http://www.google.com/search?hl=en&lr=lang_id&q=site%3Aecho.or.id&btnG=Search
> Secara default google akan menampilkan 10 site perhalaman. Anda dapat
mengubahnya secara langsung melalui URL-nya, dengan menambahkan variabel
num pada URL :D
Penggunaan num antara 1-100, contoh:
http://www.google.com/search?hl=en&lr=&q=site%3Aecho.or.id&btnG=Search
Hasil modifikasi URL
www.google.com/search?num=100&hl=en&lr=&q=site%3Aecho.or.id&btnG=Search
> as_qdr=mx: merupakan variabel lainnya yang dapat digunakan. Variabel ini digunakan menentukan hasil
berdasarkan bulan. x antara 1-12. Contoh :
http://www.google.com/search?hl=en&lr=&q=site%3Aecho.or.id&btnG=Search
Hasil modifikasi URL
www.google.com/search?hl=en&lr=&as_qdr=m1&q=site%3Aecho.or.id&btnG=Search
> safe=off: arti dari variabel ini filter "SafeSearch" dimatikan. "SafeSearch"
untuk memfilter hasil pencarian sexual.
Dengan pengetahuan di atas anda dapat membuat sendiri form Google. Sehingga tidak perlu lagi
mengunjungi http://www.google.com terlebih dahulu (kecuali anda menggunakan brwoser yang support
google secara built-in atau menggunakan Google Toolbar). Dengan melakukan ini kita bisa menghemat
bandwidth ke luar negeri . Karena bandwidth di Indonesia mahal.
Contoh script google.html lengkap dengan varabielnya.

Variabel num:

Variabel hl:

Variabel lr:

Variabel as_qdr:

Variabel safe:




Anda tinggal menghilangkan Variabel yang tidak anda inginkan atau menambahkan apapun disana.
Semuanya terserah kepada anda. Berikut merupakan script default pencarian google.



Google masih terus dikembangkan. Untuk melihat apa yang sedang dikembangkan Google. Anda bisa ke
http://labs.google.com
04 // Tips & Tricks
Dari dasar-dasar dan spesial operator tersebut anda bisa mencampurkan operator tersebut. Contoh:
- Keyword: site:echo.or.id, menghasilkan semua site echo.or.id. Kemudian anda bisa mencoba keyword:
site:echo.or.id hacker, akan menghasilkan semua site echo.or.id yang mengandung kata hacker.
Kita juga dapat melakukan pencarian secara spesifik melalui google. Untuk melakukannya anda dapat ke
site berikut:
- http://www.google.com/bsd
- http://www.google.com/mac
- http://www.google.com/linux
- http://www.google.com/microsoft
- http://www.google.com/univ/education
Berbagai trik keyword pada Google:
parent directory books -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory video -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
parent directory MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
intitle:index of intitle:mp3 -html -htm name size
intitle:index of intitle:video -html -htm name size
intitle:index of intitle:cgi-bin passwd -html -htm name size
intitle:index of intitle:cgi-bin password -html -htm name size
inurl:"admin.mdb" -html
inurl:"password.mdb" -html
inurl:"data.mdb" -html
"phpMyAdmin" "running on" inurl:"main.php"
intitle:"PHP Shell" "Enable stderr" php
Berikut ini adalah Script robots.txt untuk memproteksi website anda
User-agent: *
Disallow: /background/
Disallow: /blog/
Disallow: /cgi-bin/
Disallow: /info/articles/
Disallow: /info/conferences-past.html
Disallow: /info/meetings/examples/
Disallow: /info/meetings/thunderlizard/examples/
Disallow: /info/robots/
Disallow: /info/slides/
Disallow: /lists/
Disallow: /related/
Disallow: /reviews/
Disallow: /test/relativelinks/2ndlevel/http://
Disallow: /test/relativelinks/rtestprob/http://searchtools/about/
Disallow: /test/relativelinks/rtestprob/http://searchtools/analysis/
Disallow: /test/relativelinks/rtestprob/http://searchtools/guide/
Disallow: /test/relativelinks/rtestprob/http://searchtools/info/
Disallow: /test/relativelinks/rtestprob/http://searchtools/pub/
Disallow: /test/relativelinks/rtestprob/http://searchtools/robots/
Disallow: /test/relativelinks/rtestprob/http://searchtools/search/
Disallow: /test/relativelinks/rtestprob/http://searchtools/site/
Disallow: /test/relativelinks/rtestprob/http://searchtools/slides/
Disallow: /test/relativelinks/rtestprob/http://searchtools/surveys/
Disallow: /test/relativelinks/rtestprob/http://searchtools/tools/
Disallow: /test/robots/disal/
Disallow: /test/robots/noindex/
Disallow: /test/robots/partial
Disallow: /searchtools/
Disallow: /slides/examples/
Disallow: /ST/
Disallow: /st/
Disallow: /St/
Disallow: /wr/
# don't let search engines see the RSS feed, it's just confusing.
User-agent: Googlebot
User-agent: InfoNaviRobot
User-agent: TV33_Mercator
User-agent: AVSearch
User-agent: Mercator
User-agent: Scooter
User-agent: Slurp
User-agent: SearchengineLicenceSheep
User-agent: shadow
User-agent: MultiText
User-agent: FAST-WebCrawler
User-agent: Lycos_Spider
User-agent: Atomz
User-agent: htdig
User-agent: spider00.logika.net
User-agent: NetMechanic
User-agent: libwww-perl
User-agent: Teleport Pro
Disallow: /searchtools-rss.xml
# updated 2002-03-22 (disallow rtestprob links)
# updated 2002-06-25 (disallow info/slides links, info/robots/)
# updated 2002-07-25 (disallow /searchtools/ which is an alias)

0 komentar:

Posting Komentar

Baca juga

Cari Blog Ini

Sms-online gratis

Link Excharge
Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Powered by Blogger