ارسالی عباس
مبانی جستجوی گوگل:
وقتی شما چند کیورد (Keywords) را با هم جستجو میکنید، یک موتور جستجو یک استراتژی از پیش تعیین شدهای برای بررسی و ترکیب کیوردهای شما دارد. آیا هر یک از کیوردها میتوانند به تنهایی در هر جای صفحه وجود داشته باشند یا باید کنار هم قرار گرفته باشند؟ آیا موتور جستجو کلمات کلیدی را با هم جستجو میکند یا تکتک؟
جستجوی یک عبارت:
گوگل به صورت پیشفرض، کلمات کلیدی شما را در هر کجای صفحه، چه کنار هم باشند و چه به صورت پراکنده، جستجو میکند. برای تغییر نتایج صفحات با کلمات مرتب شده موردنظر ما، آنها را در بین دو کوتیشن قرار میدهیم.
برای جستجوی کیوردهای زیر:
گوگل کیوردها را در هر جای صفحه که آمده باشند، پیدا خواهد کرد. اگر شما میخواهید تنها نتایجی را ببینید که کیوردها با هم و به عنوان یک عبارت در صفحه آمدهاند، آنها را در بین دو کوتیشن قرار دهید:
گوگل در این حالت تنها نتایجی را نشان میدهد که کیوردها با هم ظاهر شدهاند. البته گوگل کلماتی مثل «or» و «to» را در این حالت جستجو نمیکند.
جستجوی عبارت به این روش همچنین زمانی مفید است که شما میخواهید عبارتی را بیابید، اما مطمئن نیستید که جملهبندی عبارت مورد نظر شما درست باشد که این مطلب که مکمل این قسمت است در بخش Full-Word Wildcards شرح داده شده است.
اساس بول
یک موتور همه کیوردها یا هر یک از آنها را جستجو میکند که بر اساس پیشفرض بولی صورت می گیرد. موتورهای جستجو می توانند از AND برای جستجوی همه کیوردها یا OR برای جستجوی هر کلمه استفاده کنند.
در نتیجه حتی اگر موتو جستجو به صورت پیش فرض همه کیوردها را جستجو کند شما می توانید معمولا به آن یک دستور خاصی بدهید تا آنرا برای یافتن هر کیورد راهنمایی کنید.
پیش فرض بولی گوگل AND است، یعنی اگر شما کلماتی را بدون اصلاح کننده ها جستجو نمایید همه کلمات شما را با هم جستجو می نماید.
به عنوان مثال اگر شما برای کلمات زیر جستجو کنید:
موتور، جستجو را برای همه کیوردها باهم انجام میدهد. اگر شما مایلید که مشخص کنید که هر کدام از کلمهها یا عبارات قابل قبول است یک OR بین هر کدام قرار دهید:
اگر شما اصطلاحی را به همراه یک یا دو اصطلاح دیگر میخواهید، آنها را در پرانتز قرار دهید مثل:
میتوانید جستجو برای کلمه snowmobile یا عبارت “Green Bay” به همراه کلمه Snowblower را با پایپ که معادل OR است به صورت زیر جستجو کنید که علامت | پایپ نامیده میشود:
خنثی سازی:
اگر شما مایلید که آیتمی در جستجوی شما ظاهر نشود قبل از آن – قرار دهید:
موتور در این حالت صفحاتی را که شامل snowblower snowmobile هستند و “Green Bay” را در بر ندارند خواهد یافت. نکته ای که باید به آن توجه کرد، علامت – باید درست قبل از کلمه ای که شما آن را در نتایج نمیخواهید، باید قرار بگیرد اگر از فاصله نیز استفاده شود دیگر این دستور جواب نمیدهد.
<!–pagebreak–>
بعضی از موتورهای جستجو تكنیكی به نام Stemming را پشتیبانی میكنند كه تكنیكی است كه معمولا با اضافه كردن * یا گاهی ؟ به عبارت موردنظر از موتور جستجو درخواست میكند كه به جای این علامت، مشتقات آنرا جستجو كند.
به عنوان مثال جستجوی moon* نتایجی مثل moons, moonlight, moonshot را در برخواهد داشت.
گوگل از این ویژگی به طور صریح استفاده نمیكند. ولی زمانی كه شما جای یك كلمه را در عبارتی نمیدانید، میتوانید از * استفاده كنید كه از این ستاره به معنای جانشین یك كلمه كامل در گوگل، برداشت میشود. بنابراین طبق گفته های بالا جستجو برای “three * mice” موارد زیر را در نتایج خواهد داشت:
چقدر این ویژگی گوگل بدرد میخورد؛ مطمئنا به اندازه ویژگی stemming مفید نیست ولی بازهم موجب گیج شدن مبتدیان نمیشود. یك * یك جانشین برای یك كلمه است، دو * به معنای دو كلمه و …
این ویژگی در موارد زیر قابل استفاده است:
1- فائق آمدن بر محدودیت 10 كلمه گوگل ( در گوگل عبارتهایی كه بین دو كوتیشن قرار میگیرد، نباید بیش از 10 كلمه باشد) شما این مثالها را (مثلا عبارت Fourscore and seven years ago, our fathers brought forth on this continent) كه زیاد برای پیدا كردن یك شعر یا نقل قول تكرار میشوند را، اگر امتحان كنید، گوگل تنها تا كلمه on عمل جستجو را انجام خواهد داد و همه آنچه بعد از آن میآید، توسط گوگل نادیده گرفته میشود.
2-بررسی تكرار یك عبارت معین یا مشتق عبارت مثل: (درباره دستور اینتایتل بعدا توضیح داده خواهد شد)
و یا
3- پر كردن جاهای خالی حافظه یك آدمحواسپرت! شاید شما فقط یك قسمت كوتاه یك ترانه را به یاد بیاورید كه جستجو تنها از آنچه شما به یا میآورید، به جای بازسازی تصادفی استفاده میكند.
بیایید یك مثالی را مرور كنیم، سرود “Good Times” كه توسط چیك سروده شده است، كه خط زیر را بیان میكند:
شاید شما یك ترانه را گوش كردهاید، اما شما یادتان نمی اید كه كلمه fool درست است یا چیز دیگری بوده، اگر شما اشتباه كرده باشید ( اگر درستش به عنوان مثال “You silly child, you can’t change your fate” باشد) شما هیچ جوابی نخواهید یافت.
راه حل استفاده از ویژگی گوگل است كه به جای آن كلمه سرچ كنیم:
شما این تكنیك را میتوانید برای نقلقولها و شعرهای غنایی و … به كار ببرید، شما باید حواستان را جمع كنید که به اندازه كافی از متن نقلقول را سرچ كنید تا به یك نتیجه واحد برسید. مثلا عبارت زیر كه قسمتی از مثال بالاست نتایج زیادی در بر خواهد داشت:
<!–pagebreak–>
دستورات و المانهای خاص:
علاوه بر OR و AND و جستجوهای عبارتی، Google دستورهای خاص زیادی را برای محدود نمودن جستجوی شما فراهم نموده است.
همانند همه موتورهای جستجوی Full Text، در گوگل به جای اینکه صفحات وب تنها بر اساس عنوان و توضیحات انها ایندکس شوند، صفحات وب کلا ایندکس میگردند. دستورهای خاص به کاربران گوگل اجازه میدهند که جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو
نمایند، و این اجازه را به کاربران گوگل میدهند که بتوانند جاهای معینی از صفحات وب را برای اطلاعات به خصوصی، جستجو نمایند (که آنها اپراتورهای پیشرفته نیز نامیده میشوند). این ویژگی (دستورات و المانهای خاص) خیلی چارهساز است مخصوصا زمانی که شما با بیش از 8 بیلیون صفحه وب مواجهید و میخواهید دامنه جستجوی خود را محدودتر نمایید!
مثلا ذکر اینکه اینکه کلمات عبارت مورد نظر شما تنها بایستی در عنوان یا URL صفحات وب باشد، میتواند کمک شایانی به شما برای به دست
اوردن نتایج بسیار خاص داشته باشد. در ادامه مطلب به شرح برخی از المانهای دستوری معمول خواهیم پرداخت:
intitle:
این المان جستجوی شما را به عنوان صفحات وب محدود میکند و متغیر allintitle: صفحاتی که عنوانشان تمام کلمات ذکر شده جستجو را دربردارد را پیدا میکند و هر دو دستور، قبل کیوردها استفاده میشوند.
allintitle:”windows xp” microsoft
همچنین ممکن است شما ترجیح دهید از دستور allintitle: استفاده نکنید، چون در ترکیب با دستورات دیگر ممکن است خوب کار نکند.
site:
این دستور به کاربر اجازه میدهد که جستجوی خود را به یک سایت محدود نماید.
site:thomas.loc.gov
site:edu
site:nc.us
نکته ای که تذکرش لازم است ایناست که این دستور، دستور خوبی برای یک وبسایتی که شامل زیرشاخههایی (مثل /~sam/album/ ) است، نمیباشد. مثلا شما نمیتوانید با دستور site: همه صفحات را در http://www.geocities.com/test/test1/6485 بیابید و گوگل هیچ
نتیجهای برای جستجوی شما نخواهد یافت. به جای این دستور، دستور inurl: پیشنهاد میشود.
inurl:
این دستور جستجوی شما را به URL صفحات وب محدود میکند. این دستور برای یافتن صفحات help بسیار خوب کار میکند، زیرا آنها نسبتا در
ساختار خود منظماند و allinurl: متغیری است که همه کلمات لیست شده در URL را پیدا میکند ولی در ترکیب با دستورت دیگر خوب کار نمیکند.
allinurl:search help
همانطور که میبینید استفاده inurl: به جای site: یک مزیت ضروری دارد و آن اینست که شما میتوانید از آن برای جستجوی سابدایرکتوریها (زیرفهرستها) نیز استفاده نمایید.
تذکر: در استفاده از دستور inurl: برای داشتن نتایج بیشتر از //:http استفاده نکنید.
همچنین شما میتوانید inurl: را در ترکیب با site: به کار برید تا بتوانید اطلاعات سابدامینها (زیردامنهها) را استخراج نمایید. برای مثال opensource.org چند تا سابدامین دارد؟ یک جستار سریع به شما کمک میکند تا به پاسخ این جواب برسید:
این جستجو از گوگل میخواهد تا تمام صفحات دامنه opensource.org را لیست کند، اما صفحاتی را که از زیر دامنه معمول www هستند و شما آنها را قبلا دیده بودید، نادیده بگیرید.
link:
این دستور فهرستی از صفحاتی که به URL تعیین شده لینک دادهاند را، مییابد. اگر link: را وارد کنید شما به فهرستی از صفحاتی که به
صفحه گوگل لینک دادهاند، دست مییابد ( نه در هر جای دامنه google.com ) نگران نباشید اگر ادرس شما با //:http همراه نباشد، شما
به آن نیازی ندارید. بنابراین اگر ادرس شما //:http هم داشت، باز گوگل آنرا نادیده میگیرد. این دستور به خوبی با هر URL با محتوای بزرگ کار
میکند. مثلا سرعت جستجویش در http://www.opensource.org/test/test1 فرقی با بالاترین مرتبه سایت، مثل opensource.org ندارد.
cache:
این دستور یک کپی از صفحهای که در گوگل ایندکس گذاری شده است را، مییابد. حتی اگر آن صفحه دیگر در URL اصلی در دسترس نباشد یا
محتوایش به کلی تغییر کرده باشد.
catch گوگل مخصوصا برای باز یافتن نگارش قبلی یک صفحه که بارها تغییر میکند، مناسب است.
daterange:
این دستور جستجوی شما را به تاریخ به خصوصی یا یک محدوده تاریخی که صفحه در گوگل ایندکس گذاری شده، محدود مینماید. باید در نظر داشت که این جستجو، کاری به تاریخی که یک صفحه ساخته شده است، ندارد و تنها بر مبنای تاریخ ایندکس گذاری در گوگل، عمل میکند.