............................................................................................
این مقاله سعی دارد تا با اشاره به موارد مختلفی که می تواند در جستجو و بازیابی اطلاعات سرعت و دقت و جامعیت و مانعیت جستجو را بالاببرد موجب افزایش مهارت کاربران اینترنت فارسی بشود.
توصیه های زیر برای انتخاب کلمات کلیدی و نیزجستجوی دقیق و مفید پیشنهاد می شود:
1- حتی المقدور سعی شود کلمات کلیدی از میان اصطلاحات منحصر به فرد و اسامی خاص انتخاب بشود.
2- حتی المقدور از آوردن کلمات عمومی که عناوین بسیاری را در زیر مجموعه خود شامل می شوند جداً خودداری کنید.
3 – همیشه اسم شخص یا نام شی یا هر چیز دیگری را که مد نظر دارید بطور کامل وارد کنید.
4 – دقت کنید که اگر موتور جستجو میان حروف بزرگ و کوچک تفاوتی می گذارد، این مسیله را در طرح کلمات کلیدی خود مد نظر داشته باشید.
5 – در نظر داشته باشید اگر نتیجه جستجو صفر بود به احتمال زیاد می تواند از یک اشتباه تایپی باشد.
6 – اگر املای صحیح و کامل کلمه ای را نمی دانید از کارکتر جانشین که اغلب * و یا ؟ است استفاده کنید.
7 – اگر یک کلمه کلیدی را برای طرح دقیق و تمام و کمال یک مورد جستجو کفایت نمی کند از تکنیک های جستجوی عبارتی، استفاده از اپراتورهای جبر بولین (AND, OR, NOT) استفاده کنید. جستجوی عبارتی یکی از مهم ترین و قدرتمندترین امکانات جستجو در اغلب موتورهای جستجو می باشد و می توان یک عبارت یا جمله مشخص را به همان ترتیبی که کلمات وارد شده اند مورد جستجو قرار داد. برای این روش جستجو عبارت مورد نظر را داخل گیومه"" بگذارید
8 - استفاده از عملگر AND : and به مفهوم "و" برای محدود کردن دامنه جستجو از طریق ترکیب کلیدواژه های مختلف به کار می رود و برای ترکیب کلیدهای جستجو زمانی که برای شما مهم است که دو یا چند کلمه کلیدی حتماً وجود داشته باشد و علامت آن در پایگاه های مختلف به صورت استفاده از عبارت and ،استفاده از + ، انتخاب عبارت all the word از منو، انتخاب عبارت match on all words (and) بوسیله کلیک کردن بر روی دکمه های رادیویی می باشد.
9 – استفاده از عملگر OR: اپراتور OR به مفهوم "یا" و برخلاف عملگر AND باعث گسترش دامنه جستجو و بازیابی اطلاعات بیش تر شده برای ترکیب کلیدواژه های جستجو زمانی که انتظار دارید تنها یک، دو یا چند کلمه کلیدی حضور داشته باشند و علامت آن استفاده از عبارت or، نحوه اجرای ساده و معمولی آن، انتخاب عبارت any of the words از منو، انتخاب عبارت match on any words (or) با کلیک بر روی دکمه های رادیویی می باشد. یکی از کاربردهای مهم این عملگر پوشش مفاهیم یا اصطلاحات مترادف، مرتبط، یا با املاهای متفاوت می باشد.
10 – استفاده از عملگر NOT : اپراتور Not به مفهوم "نه" و یا به جز که در این صورت تمامی جواب های بازگشتی که حاوی عبارت یا کلمه کلیدی هستند حذف خواهند گردید و برای اجرای آن تنها کافیست که not را قبل از عبارت یا کلمه کلیدی مورد نظرتان با یک فاصله بیاورید.
11 – استفاده از کوتاه سازی [14]کلید واژه ها: این تکنیک به ما امکان می دهد که با وارد کردن بخشی از یک کلیدواژه بتوانیم مشتقات مختلف آن را نیز در فرآیند جستجو بازیابی کنیم. اکثر موتورهای جستجو این تکنیک را با استفاده از علامت ستاره (*) ارایه می دهند. یکی از مشکلات استفاده از این تکنیک این است که باعث بازیابی اطلاعات غیرمرتبط و ناخواسته زیادی می شود.
12 – استفاده از عملگر نزدیک یابی[15]: در بسیاری از موارد استفاده از عملگر and باعث بازیابی اطلاعاتی شود که برای ما مفید نمی باشد، به این دلیل که این عملگر کلیدواژه ها را در هر کجای متن که باشند بازیابی می کند. در این موارد استفاده از تکنیک نزدیک یابی می تواند از ریزش کاذب اطلاعات و یا بازیابی اطلاعات غیر مرتبط جلوگیری نماید. همه موتورهای جستجو قابلیت استفاده از این تکنیک را ندارند ولی به عنوان مثال در موتور جستجوی آلتاویستا می توان با استفاده از عملگر NEAR از این تکنیک استفاده نمود.
13 – جستجوی ترکیبی با استفاده از پرانتز: این تکنیک یکی از مهم ترین تکنیک های جستجو می باشد که به وسیله آن می توان تا حدود زیادی از بازیابی موارد غیر مرتبط در محیط وب جلوگیری کرد. در این روش می توان از همه عملگرهای جستجو که در بالا گفته شده یک جا استفاده کرد و آن ها را با هم دیگر ترکیب نمود.
14 – جستجوی کلیدواژه در عنوان صفحات وب: این تکنیک با این پیش فرض که عنوان یک صفحه وب تا حدود زیادی نمایان گر محتوای اطلاعات موجود در آن است به جستجوی واژه های کلیدی در عنوان سایت ها می پردازد. علامت آن در موتورهای جستجو متفاوت است ولی اغلب موتورهای جستجو از طریق فهرست انتخابی و یا گزینه های دیگر این امکان را فراهم می آورند.
15 – جستجوی حوزه سایت ها: با توجه به این که به صورت قراردادی هر کشوری حوزه خاصی در محیط وب دارد، قابلیت جستجوی حوزه سایت ها به ما این امکان را می دهد که فرایند جستجو را به حوزه خاصی نظیر سایت های وب ایران (ir) و یا سایت های وب سازمان های غیر انتفاعی (org) محدود کنیم. دستورات استفاده از این تکنیک در موتورهای جستجو مختلف می باشد.
16 – محدود کردن جستجو به زبان های مختلف؛ باعث می شود نتایج جستجو به زبان های دیگر آورده نشود و انتخاب مطلب مورد نظر آسان تر است.
17 – محدود کردن جستجو به تاریخ انتشار منابع در وب: تاریخ انتشار یا به اصطلاح روزآمدی مطلب به خصوص در منابع علمی اصل مهمی است و این گونه محدودیت باعث می شود بنا به نیاز کاربر جدیدترین و یا قدیمی ترین منبع بازیابی بشود.
18 – جستجوی رسانه های مختلف: موسیقی، عکس، ویدیو : زمانی که فقط نوع خاصی از رسانه مورد نیاز است به عنوان مثال زمانی که به عکس یک شخصیت نیاز داریم، جستجو در میان عکس ها باعث می شود نتیجه جستجو شامل اطلاعات دیگری در مورد آن شخصیت نباشد.
19 – جستجوی صفحات با فرمت های مختلف: PDF, Word, MP3, MPEG, ….: زمانی که فرمت خاصی مورد نظر است می توان از این تکنیک استفاده کرد . به عنوان مثال اگر مایل باشیم منبع بازیابی شده در فرمت PDF باشد، این تکنیک می تواند مفید باشد.
20 – آگاهی از پیش فرض های جستجو در موتور جستجو: با توجه به این که هر موتور جستجو برای ترکیب واژه ها یک پیش فرض دارد و اگر از هیچ گونه عملگری استفاده نشود، کلیدواژه ها را به صورت پیش فرض با یکی از عملگرهای جبر بولی ترکیب می کند؛ آگاهی از این پیش فرض موتورهای جستجوی مختلف مهارت ما را در جستجو بالا می برد.
21 – وب نامریی: وب نامریی به دو دلیل کمی و کیفی اهمیت دارد کمی از این نظر که موتورهای جستجو فقط قادر هستند حدود 16 درصد از اطلاعات موجود دراینترنت را بازیابی کنند و اندازه وب نامریی تقریبا 500 برابر وب مریی است و کیفی از این نظر که منابع اطلاعاتی موجود در وب عمیق معمولا ارزشمند و مفید هستند و در بسیاری از موارد پاسخ¬گوی نیاز کاربران می¬باشند. آشنایی با ابزارهایی که برای شناسایی منابع وب نامریی به وجود آمده¬اند و کاربران را به سایت¬های مناسب راهنمایی می¬کنند، باعث دسترسی به این بخش عظیم از اطلاعات مفید و ارزشمند می¬شود. مثل سایت Invisibleweb که فهرستی از منابع نامریی را و سایت Completeplaset که فهرستی از تقریبا 40000 پایگاه اطلاعاتی وب نامریی را ارایه می¬دهد.[16]
راهبرد جستجو در اینترنت
جستجو عبارت از جستجو در منابعی مشخص با استفاده از کلیدواژه ها و عبارت های خاص در حوزه های موضوعی ویژه است. طراحی نظام مند مراحل انجام یک جستجو را راهبرد جستجو می گویند به نظر پایو «راهبرد جستجو عبارت است از فرایندی که از طریق آن فایلی مورد جستجو قرار می گیرد تا مدارک متناسب با نیاز کاربر شناسایی شود. این مدارک بر اساس مجموعه ای از معیارهایی که شخص متقاضی مطرح می کند بازیابی می شود»[17] هر فرایند جستجو می تواند به مراحل ارایه درخواست دقیق، انتخاب منابع اطلاعاتی مناسب، آماده کردن جستجو و اجرای جستجو تقسیم شود. بر خلاف منابع نمایه سازی شده در پایگاه های اطلاعاتی کتاب شناختی؛ مدارک در اینترنت از طریق واژگان کنترل شده قابل بازیابی نیستند. بنابراین جستجوگر برای بازیابی باید بر فنون خاص اینترنت متکی باشد. نخست آگاهی از ابزارهای مختلف جستجو در اینترنت و در ادامه انتخاب یکی از این ابزار برای جستجوی اطلاعات مورد نیاز می باشد. هزاران موتور جستجو، صدها ابرموتور جستجو و راهنماهای موضوعی وب و پایگاه های تخصصی وجود دارد و انتخاب درست ابزار جستجو در ابتدای کار جستجو می تواند یک جستجوی موفق را باعث گردد. در زیر چند معیار برای انتخاب ابزار جستجو آورده می شود:
- اگر در جستجوی اطلاعات خاصی باشید بهتر است از موتورهای جستجو استفاده کنید.
- اگر در جستجوی یک واژه مبهم یا منحصر به فرد هستید از ابرموتورهای جستجو استفاده نمایید.
- اگر در جستجوی اطلاعات عمومی روی موضوعات عام هستید از راهنماهای موضوعی وب استفاده کنید.
- اگر در حال جستجوی اطلاعات علمی هستید از کتابخانه های مجازی استفاده کنید.
- اگر در جستجوی آخرین اطلاعات یا برای تغییر پویای فهرست مطالب، آخرین خبرها، راهنماهای دفتر تلفن، دسترسی به زمان پروازهای هوایی و غیره هستید از پایگاه های تخصصی استفاده کنید.[18] برای جستجوی اطلاعات از اینترنت چهار شیوه وجود دارد شیوه نخست دسترسی به اطلاعات از طریق نشانی پایگاه اطلاعاتی مورد نظر بر روی اینترنت (URL) است، که در این صورت نشانی پایگاه اطلاعاتی در سطر نشانی برنامه مرورگر وب تایپ می شود و برنامه مرورگر وب مراجعه کننده را به وب سایت آن نشانی هدایت خواهد کرد. اما اگر فقط یک حرف یا علایم نقطه گذاری از قلم بیفتد، برنامه مرورگر نخواهد توانست آن پایگاه را باز نماید. روش دوم دنبال کردن لینک های موجود در صفحات وب است که کاربران را از صفحه ای به صفحه دیگر هدایت می کند. این سهولت دسترسی به منابع در وب از امتیازات بزرگ آن است و برای کاربران امکان مرور سریع و آسان در منابع مختلف را فراهم می کند. روش سوم بازیابی گزینشی اطلاعات است که در آن در واقع به جای آنکه کاربران شخصا در جستجوی اطلاعات مورد نظر باشند، موضوعات مورد نیاز خود را به سیستم¬های بازیابی گزینشی می سپارند و سپس در طول زمان، اطلاعات دریافتی جدید توسط سیستم برای آنها به طور خودکار ارسال خواهد شد. چهارمین روش که در واقع معمول ترین و متداول ترین راه بازیابی اطلاعات در وب است استفاده از موتورهای جستجو است. هنگام جستجو باید دقت کرد که موتور جستجو به طور معمول هوش مند نیست و معمولاً به دنبال کلیه کلیدواژه هایی که شما به دستگاه داده اید بدون توجه به معنای آن ها می گردد.
نکات کلیدی جستجو به زبان فارسی
برای جستجوی مطالب فارسی طبق گفته های پیشین چنانچه آدرس سایت به خصوصی که در زمینه موضوعی مورد نظر ما فعالیت می کند را داشته باشیم؛ می توان مستقیماً به آن سایت رفته و از مطالب آن استفاده نمود. به عنوان مثال سایت تخصصی برنامه نویس مطالب مفیدی در زمینه رایانه و علوم وابسته، به ما ارایه می دهد و یا سایت عمران در زمینه موضوعی عمران فعالیت می نماید و نیز سایت های انجمن ریاضی در زمینه ریاضی، سایت انجمن فیزیک ایران در زمینه فیزیک، سایت انجمن روان¬شناسی ایران در زمینه روان¬شناسی و علوم تربیتی فعالیت می نمایند، مرکز اطلاعات و مدارک علمی ایران با دارا بودن پایگاه های اطلاعاتی مختلف مخصوصا پایگاه پایان نامه ها می تواند مورد استفاده متخصصین تمام رشته ها گردد. ولی چنان¬چه امکان استفاده از این سایت ها نباشد و یا آدرس این سایت ها را نداشته باشیم بایستی مطلب مورد نظر خود را بوسیله یکی از موتورهای جستجو پیدا بکنیم. انتخاب موتور جستجو عامل مهمی در فرایند جستجو است. در حال حاضر ابزارهای کاوش مختلفی در ایران ظهور پیدا کرده¬اند. لیکن ابزارهای جستجویی که امکان جستجوی اطلاعات به زبان فارسی را در اختیار قرار می دهند، محدودند. از طرف دیگر، امکانات و قابلیت های آن ها برای بازیابی موثر و مناسب اطلاعات متغیر هستند. برخی از ابزارهای کاوش با امکانات جستجوی فارسی عبارتند از: ان.پی. ایرانNPiran ، ایران هوIranhoo ، ایران مهرIranMehre ، پارسیک Parseek ، گوگل Google. در بین ابزارهای کاوش فوق ، تنها موتور کاوش گوگل دارای برنامه روبات به منظور شناسایی و نمایه¬سازی صفحات یا سایت¬های وب به زبان فارسی و نمایه¬سازی خودکار می¬باشد و قادر است صفحات فارسی را در قالب یونی کد شناسایی و در پایگاه خود نمایه کند و سایت پارسیک نیز از پایگاه گوگل برای جستجو و بازیابی اطلاعات استفاده می¬کند. به تعبیر دیگر، چهار ابزار کاوش دیگر توسط نمایه سازی انسانی اداره می شوند و از این لحاظ راهنمای موضوعی تلقی می شوند و انسان، فرآیند شناسایی، بررسی و نمایه سازی سایت ها یا صفحات وب را بر عهده دارد.[19]معمولاً به جهت دامنه وسیع موضوعی و نیز صفحه به زبان فارسی گوگل اکثر کاربران از این موتور جستجو استفاده می نمایند. برای جستجوی بهتر توجه به نکات زیر ضروری به نظر می رسد:
- با ترکیب چند واژه کلیدی مهم خیلی سریع می توانیم مطلب مورد نظر خود را بدست بیاوریم.
- دقت در انتخاب کلید واژه ها به طوری که واژه های انتخابی بطور دقیق نماینده نیاز اطلاعاتی ما باشند کمک خواهد کرد تا از نتایج جستجوی گسترده ای که در اکثر موارد بار اطلاعاتی مفید ندارند دوری گزینیم.
- استفاده از تکنیک جستجوی عبارتی که در آن عبارت جستجوی مورد نظر خود را داخل گیومه" " می گذاریم و به این ترتیب به موتور جستجو می گوییم که مطلب مورد نظر ما بایستی عین این عبارت باشد، نیز در محدود کردن نتایج جستجو کمک فراوان می کند.
- استفاده از انواع محدودگرهای زبانی، زمانی، مکانی، شکلی، و موضوعی و ... در جستجوی پیشرفته گوگل به ما در رسیدن سریعتر به مطلب مورد نظر کمک فراوانی می کند.
- به علت این که منابع و اطلاعات موجود در اینترنت بوسیله افراد مختلف و بدون کنترل در شیوه های رسم الخط و بدون ویرایش صاحب نظران منتشر می گردد آشنایی با گونه های مختلف نوشتاری و املاهای مختلف یک واژه و یا یک مفهوم در زبان فارسی به ما کمک می کند که با جستجوی گونه های مختلف نوشتاری یک واژه یا یک مفهوم و استفاده از واژه های مترادف و متشابه و شکل های دیگر نوشتاری آن واژه و نیز استفاده از انواع شکل های جمع و مفرد یک واژه جامعیت جستجوی خود را بالا ببریم . به عنوان مثال برای جستجوی مطلبی در زمینه بتن بایستی آنرا به دو صورت «بتون» و « بتن» جستجو نماییم تا به تمام مطالبی که در زمینه بتن می باشد دسترسی داشته باشیم و یا به عنوان مثال دوم برای جستجوی مطلبی در باره «آبگرمکن» برای دستیابی به همه اطلاعات موجود بایستی آن را به چهار شکل زیر بنویسیم «آب گرم کن، آب گرمکن، آبگرم کن، آبگرمکن» واضح است که هر کدام از این کلمات نتایج متفاوتی را در موتور جستجو بدست می دهد. «استاد، اساتید، استادان، استادها» «آمریکا، امریکا» «ییدروژن، هیدروژن» «آنلاین، پیوسته، درون خطی» از مثال¬های دیگری هستند که جستجو به تمام این شکل ها جامعیت جستجوی ما را زیاد می کند و به ما در از دست ندادن مطالب مفید کمک می کند .
- با استفاده از عملگرهای بولی، دقت جستجو را بالا برده و نتایج جستجوی کم و مفیدی را بدست بیاوریم.
- مترادفات: با استفاده از شکل های مختلف مترادفات موجود برای یک مفهوم و هم چنین شبه مترادفات و یا حتی گاهی کلمات متضاد مثل بی سوادی و سوادآموزی در جستجو می توان جامعیت جستجو را بالا برد.
- اسامی مشهور و اسامی علمی: آگاهی از شکل های مختلف اسامی علمی و مشهور عامیانه و اسامی تجاری یک پدیده و یا وسیله و ... و استفاده از آن ها می تواند جامعیت جستجو را بالا ببرد.
- با توجه به این که در اکثر وب ها از واژه خارجی یک کلمه به همان صورت و با همان الفبا استفاده می شود استفاده از شکل خارجی این لغات و واژه ها نیز می تواند جامعیت جستجوی ما را بالاتر ببرد.
- با توجه به این که در برخی از سایت ها و نیز وبلاگ ها روش خاصی برای رفع مشکلات فارسی پیشنهاد کرده اند و واضح است که خودشان نیز از آن رسم الخط استفاده می کنند، آگاهی از این شکل های مختلف و جستجو به این شکل ها می تواند باعث جامعیت جستجو گردد. از این موارد می توان به حذف واو معدوله در برخی سایت ها و وبلاگ ها اشاره کرد که به عنوان مثال «خواهر» را به صورت «خاهر» می نویسند و یا حذف تنوین در برخی منابع که به عنوان مثال «عملاً» را به صورت «عملن» می نویسند. در نهایت این که «در تشکیل صفحات وب فارسی ، جای یک استاندارد حاکم بر عملکرد تالیف نویسندگان وب، خالی است. استانداردی که انتخاب بعضی کلمات دارای چندین رسم الخط و حتی انتخاب بعضی کلمات که بر مفاهیم متنوعی دلالت دارند را منحصر به فرد نماید و مولفان را از طرفی ترغیب به انتخاب گونه زبانی مناسب، برای تضمین کیفیت ارتباط و انتقال موثر پیام و از طرف دیگر موظف به حفظ سلامت زبان و رعایت استانداردهای آن به عنوان یک وظیفه رسانه ای نماید. ایجاد و گسترش چنین استانداردی به عهده "فرهنگستان زبان و ادب فارسی" و با هماهنگی انجمن ها و شوراهای علمی یا صنفی انفورماتیک در ایران است. تعویق در تنظیم این استاندارد ، با توجه به رشد روز افزون وب های فارسی زبان ، هزینه های جبران ناپذیری در بر خواهد داشت.»[20]
[1] بر گرفته از: محمد صابر راثی ساربانقلی. " بررسی مشکلات جستجو و بازیابی اطلاعات به زبان فارسی از اینترنت با مطالعه موردی بر روی کاربران مرکز اینترنت دانشگاه آزاد اسلامی واحد شبستر" . پایان¬نامه کارشناسی ارشد کتابداری و اطلاع¬رسانی، دانشگاه آزاد اسلامی، واحد تهران شمال، 1384