وب
آمار بین
علم آمار و احتمالات برای اندازه گیری متغیر ها
وب جهانگسترجهان وب٬ وب جهانگستر٬ تار گیتیگستر٬ یا به طور ساده وب (به انگلیسی: World Wide Web) یک سامانهٔ اطلاعاتی از پروندههای ابرمتنی متصلبههم است که از طریق شبکهٔ جهانی اینترنت قابل دسترسی هستند. بهکمک یک مرورگر وب میتوان صفحات وب (که شامل متن، تصویر، ویدیو و سایر محتویات چندرسانهای هستند) را مشاهده و بهکمک ابرپیوندها در میان آنها حرکتکرد.
تیم برنرز لی، یک پژوهشگر علوم رایانه و کارمند موسسهٔ سرن در نزدیکی ژنو، در ماه مارچ سال ۱۹۸۹ میلادی پیشنهاد اولیهٔ وب امروزی را مطرح کرد. پیشنهاد ارائهشده در ۱۹۸۹ قرار بود که یک سیستم ارتباطی برای موسسه سرن شود، اما برنرز لی بهزودی متوجهشد که این ایده قابلیت جهانیشدن را دارد. برنرز لی به همراه رابرت کایلیائو در سال ۱۹۹۰ میلادی این پیشنهاد را بهعنوان «پیوند و دسترسی به اطلاعات مختلف بهصورت تارنمایی از گرههایی که کاربران به دلخواه در میان آنها حرکت میکنند» ارائه دادند. برنرز لی در ماه دسامبر همان سال اولین وبگاه را بهوجودآورد و در ۷ اوت سال ۱۹۹۱ میلادی آنرا بهعنوان یک پروژه بر روی گروه خبری alt.hypertext منتشر کرد.
واژهٔ وب
واژهٔ وب (به معنی تار) در بسیاری از ترکیبات «اینترنتی» میآید. کم کم «وب» بهعنوان واژهٔ بینالمللی جا افتاده و به منظورهای مختلفی به کار میرود. این واژه معمولاً به صورت اشتباه به جای اینترنت به کار میرود اما وب در حقیقت یکی از خدماتی است که روی اینترنت ارایه میشود (مانند پست الکترونیکی).
همچنین، وب مخفف کلمه وبسایت (website) است. سایت یعنی مکان و منظور از وبسایت صفحات مرتبط است. در پارسی واژهٔ تارنما جایگزین وبسایت شده است.
تاریخچه
ایده اولیه در مورد تارِ گیتیگستر به سال ۱۹۸۰ (میلادی) برمیگردد. زمانی که در شهر سرن سوئیس، تیم برنرز لی شبکه ENQUIRE را ساخت (که به "Enquire Within Upon Everqthing CSS" اشاره داشت و همنام کتابی بود که وی از جوانی خود به یاد داشت. اگرچه آنچه وی ساخت با وب امروزی تفاوتهای زیادی دارد اما ایده اصلی در آن گنجانده شده است (و حتی برخی از این ایدهها در پروژه بعدی برنرزلی پس از WWW یعنی وب معنایی به کار گرفته شد).
در مارس 1989، برنرزلی یک پیشنهاد را نوشت که به ENQUIRE اشاره داشت و یک سیستم اطلاعاتی پیشرفته را توصیف میکرد. وی با کمک رابرت کایلا، پیشنهاد طراحی تور جهان گستر را در 12 نوامبر 1990 ارائه کرد. اولین مرور وب جهان توسط برنرزلی با عنوانNEXTcube مورد استفاده قرار گرفت و وی اولین مرورگر وب و تور جهان گستر را در سال 1990 طراحی کرد.
در کریسمس 1990، برنرز لی همه ابزارهای لازم برای کار با وب را فراهم کرد
در 6 آگوست 1991 وی خلاصهای از پروژه تور جهان گستر را در گروه خبری alt.hypertext پست کرد. در همین روز وب به عنوان یک خدمات عمومی روی اینترنت ارائه شد. مفهوم مهم ابر متن در پروژههای قدیمیتر مربوط به دهه 1960 مانند Project Xanadu مربوط به تد نلسون و NLS (سیستم آنلاین) مربوط به داگلاس انگلبارت مطرح شد.
موفقیت برنرزلی در ایجاد ارتباط بین ابر متن و اینترنت بود. در کتاب "بافتن تور" وی اذعان میکند که بارها از امکان برقراری ارتباط میان دو تکنولوژی صحبت کرده بود اما چون کسی به حرفهایش توجه نکرد وی خودش دست به کار شد و پروژه را به سرانجام رساند. وی در سیستم خود شاخصهای منحصر به فرد جهانی برای شناسایی منابع موجود روی وب و دیگر مکانها در نظر گرفت و آنها را شناسه منبع یکپارچه نامید.
تور جهان گستر با بقیه سیستمهای ابر متنی موجود تفاوتهایی داشت:
WWW به لینکهای یک طرفه نیاز داشت و نه دوطرفه بنابراین فرد میتوانست بدون آن که از جانب مالک منبع واکنشی صورت گیرد به منبع دسترسی پیدا کند. همچنین ابر متن مشکل پیادهسازی سرورهای وب و مرورگرها (در مقایسه با سیستمها قبلی) را برطرف کرد اما در مقابل مشکل زمان در لینکهای قطع شده را ایجاد کرد.
تور جهان گستر بر خلاف سیستمهای قبلی مانند ابر کارت غیر انحصاری بود و این امکان را فراهم میکرد که سرورها و مرورگرهای مستقلی را ایجاد کرده و بدون هیچ محدودیتی آنها را به شبکه وصل کرد.
در 30 آوریل سال ۱۹۹۳ (میلادی)، CERN اعلام کرد که تور جهان گستر به صورت رایگان برای همه افراد قابل دسترسی است. این موضوع دو ماه پس از اعلام رایگان نبودن پروتکل گوفر مطرح میشد و در نتیجه تمایل به وب به شدت افزایش یافت. قبل از آن مرورگر وب معروفی به نامViolaWWW وجود داشت که بر اساس ابر کارت کار میکرد. نسخه گرافیکی تور جهان گستر با نام مرورگر وب موزائیک در سال 1993 توسط مرکز ملی برنامههای سوپرکامپیوتر که توسط مارک اندرسن راه اندازی شده بود مورد انتقاد شدید قرار گرفت. قبل از عرضه موزائیک، گرافیک و متن در صفحات وب از یکدیگر جدا بودند و در پروتکلهای اینترنتی قبلی مانند پروتکل گوفر و مرور اطلاعات ناحیه وسیع گرافیک کاربرد زیادی نداشت. واسط کاربر گرافیکی موزائیک وب را به مشهورترین پروتکل اینترنتی تبدیل کرد.
اجزاء وب
تار گیتیگستر ترکیبی از چهار عنصر اصلی است:
hypertext یا بسامتن: فرمتی از اطلاعات که به افراد اجازه می دهد تا در محیط کامپیوتر با استفاده از ارتباط داخلی موجود میان دو متن از بخشی از سند به بخش دیگری از آن یا حتی سند دیگری مراجعه کنند و به اطلاعات جدیدی دسترسی پیدا کند.
URL: شناسههای منحصر به فردی که برای مشخص کردن محل حضور اطلاعات موجود روی شبکه (فایل کامپیوتری، سند یا منابع دیگر) به کار می روند.
مدل Client-Server یا مشتری-خدمتگزار: سیستمی که در آن نرمافزار یا کامپیوتر مشتری از نرمافزار یا کامپیوتر خدمتگزار تقاضای دریافت منابع اطلاعاتی مانند داده یا فایل می کند.
markup language یازبان علامتگذاری: کاراکترها یا کدهای موجود در متن که ساختار متن وب معنایی را مشخص می کنند.
معماری سیستم وب
کلاً از دیدگاه فنی سیستم وب در دو بخش سازماندهی می شود:
برنامه سمت سرویس دهنده ی وب و برنامه سمت مشتری وب
پایگاه اطلاعاتی توزیع شده از صفحات ابرمتن، فایل های داده مثل صدا، تصویر و بطور کل هر منبع
صفحه وب چیزی نیست مگر یک فایل متنی بسیار ساده که با یکی از زبان های نشانه گذاری ابرمتنی مثل HTML، XHTML ، DHTML یا XML تدوین می شود. کاری که مرورگر به عنوان مشتری وب انجام می دهد آن است که تقاضای دریافت یکی از صفحات یا فایل ها را در قالب قراردادی استاندارد (به نام پروتکل HTTP) به سمت سرویس دهنده ارسال کند. در سمت مقابل سرویس دهنده ی وب این تقاضا را پردازش کرده و در صورت امکان، فایل مورد نظر را برای مرورگر ارسال می کند. مرورگر پپس از دریافت فایل ابرمتنی ، آن را تفسیر کرده و به صورت صفحه آرایی شده روی خروجی نشان می دهد. اگر فایل ابرمتنی در جایی به فایل صدا یا تصویر پیوند خورده باشد آن ها نیز توسط مرورگر تقاضا شده و پس از دریافت در جای خود قرار می گیرند.
وب چگونه عمل میکند
برای مشاهده یک صفحه وب یا دیگر منابع اطلاعاتی روی تور جهان گستر معمولاً URL صفحه را در یک مرورگر وب وارد میکنیم و یا لینک ابر متن مربوط با آن صفحه یا منبع را انتخاب میکنیم. اولین گام که در پشت پرده انجام میشود اختصاص یک آدرس IP به بخش سرور URL است که توسط پایگاه داده توزیع شده اینترنت صورت میگیرد که به آن DNS میگویند.
در مرحله بعد یک درخواست HTTP به مرور وب در آن آدرس IP ارسال میشود و درخواست مشاهده صفحه ارائه میگردد. در صورتی که یک صفحه معمولی در خواست شده باشد متن HTML، تصاویر گرافیکی یا هر فایل دیگری که مربوط به آن صفحه است در اختیار مشتری (مرورگر وب) قرار میگیرد. سپس مرورگر وب صفحه HTML، و دیگر فایلهای دریافت شده را ترجمه میکند. در نهایت "صفحه" مورد نظر مشتری در اختیار وی قرار میگیرد.
در تور جهان گستر، یک برنامه مشتری که عامل کاربر نام دارد منابع اطلاعاتی مانند صفحات وب یا فایلهای کامپیوتری را با استفاده از URL از وب در خواست میکند. اگر عامل کاربر نوعی مرورگر وب باشد، اطلاعات را روی مانیتور نشان میدهد. کاربر میتواند با دنبال کردن لینکهای موجود در صفحه وب به بقیه منابع موجود روی تور جهان گستر دسترسی پیدا کند. همچنین میتوان با پرکردن فرمهای HTML و تحویل این فرمهای وب میتوان اطلاعات را بر اساس پروتکل انتقال ابرمتن به سرور وب برگرداند تا از آن ذخیره شده یا پردازش شوند. صفحات وب در کنار هم قرار گرفته و وبسایتها را می سازند. عمل دنبال کردن ابرلینک از یک وب سایت به وب سایت دیگر را "مرور وب" یا " گشت و گذار" وب مینامند.
اصطلاح "گشت و گذار در اینترنت" اولین بار توسط جین آرمور پولی که یک کتابدار بود در مقاله یا به نام "Surfing the INTERNET" مطرح شد که ژوئن سال 1992 در "بولتن کتابخانه ویلسن" در دانشگاه مینوستا چاپ شد. اگر چه پولی مستقلاً از این کلمه استفاده کرد اما در یوزنتهای مربوط به سالهای 1991 و 1992 این کلمه دیده میشود و حتی عدهای میگویند که این کلمه در مجمع هکرها در دو سال قبل از آن به صورت شفاهی عنوان شده بود. پولی در تاریخ اینترنت به مادر اینترنت معروف است.
اغلب صفحات وب شامل ابر لینکهایی هستند که به صفحات و منابع اطلاعاتی مرتبط با آنها مانند صفحات دانلود، اسناد منابع، تعاریف و غیره منتهی میشوند. چنین مجموعهای از منابع مفید و مرتبط با هم توسط لینکهای ابر متن به یکدیگر متصل شدهاند را "وب" اطلاعات مینامند. قرار دادن این مجموعه منابع روی اینترنت شبکهای را تولید کرد که در اوایل دهه 1990 توسط تیم برنرز لی، " تور جهان گستر" نامیده شد.
عملکرد برنامه ی سرویس دهنده و مشتری وب
در سمت سرویس دهنده ی وب، پروسه ای وجود دارد که دائماً به پورت شماره 80 گوش می دهد و منتظر تقاضای برقراری اتصال توسط مشتریان می ماند. دقت کنید که برنامه ی سرویس دهنده از سوکت های نوع استریم استفاده می کند و اتصال از نوع TCP است. فرامین و داده هایی که بین سرویس دهنده و مرورگر وب مبادله می شوند تماماً متنی هستند.(همانند سیستم پست الکترونیکی) پس از آنکه ،ژ\ بین برنامه ی سویس دهنده و مشتری برقرار شد برنامه ی مشتری حق دارد یک یا چندین تقاضا بفرستد و این تقاضا ها باید در قالب استاندارد HTTP باشد. سرویس دهنده، یکایک تقاضا ها را دریافت و پردازش و در صورت امکان آن ها را اجرا می کند.
کش (cache)
اگر کاربر پس از مدت زمان اندکی به سرعت به صفحه وب برگردد احتمال دارد که اطلاعات از سرور وب اصلی بازیابی نشوند. به طور پیش فرض، مرورگرهای همه منابع وب را روی هارد کامپیوتر مشتری، مخفی (کش) میکنند. مرورگر درخواست HTML را تنها در صورتی که نیاز به روزآوری دادههای قبلی وجود داشته باشد ارسال میکند. در غیر این صورت از دادههای کش استفاده میشود.
این عمل باعث کاهش ترافیک شبکه اینترنت میشود. تصمیمگیری در مورد انقضای زمان استفاده از منبع تصویر، CSS، فایل جاوا اسکریپت و همچنین HTML به صورت مستقل انجام میگیرد. بنابراین حتی در برخی از سایتهای با محتوای پویا، بسیاری از منابع اطلاعاتی اصلی فقط در هر بار مراجعه عرضه میشوند. بهتر است طراحان وب سایت همه فایلهای جاوا اسکریپت و CSS را درون تعدادی فایل سایت جمعآوری کنند تا کش های کاربران بتوانند از آنها استفاده کنند و بدین ترتیب زمان دانلود شدن صفحه و تعداد مراجعات به سرور کاهش یابد.
همچنین بخشهای دیگری از اینترنت میتوانند محتوای وب را کش (مخفی) کنند. یکی از بهترین این اجزاء دیوارهای آتش است که در شرکتها و محیطهای دانشگاهی کاربرد دارد و منابع وب درخواست شده توسط یک کاربر را برای همه کاربران کش میکند. با وجود آن که این قابلیتها در اغلب مرورگرهای وب دیده میشود طراحان صفحات وب میتوانند عناوین HTTP که توسط کاربر درخواست شده را کنترل کنند تا صفحات در مواردی که لازم نیست در کش ذخیره نشوند؛ مثلاً صفحات خبری و بانکها.
بدین ترتیب میتوانیم بین اعمال "دریافت" و "ارسال" HTTP تفاوت قائل شویم. در صورتی که همه شرایط محقق شود، دادههایی که توسط فرمان دریافت (GET) درخواست شدهاند میتوانند در کش ذخیره شوند در حالی که دادههای به دست آمده پس از ارسال (posting) اطلاعات به سرور در کش ذخیره نمیشوند.
جاوا و جاوا اسکریپت
این سیستم به سرورهای وب امکان میدهد تا برنامههای کوچکی (که اپلت (applet) نامیده میشوند) را مستقیماً در شبکه اطلاعات بازیابی شده قرار دهند و این اپلتها که در کامپیوتر کاربر اجرا میشوند تعامل کاربر با اینترنت را سرعت میبخشد. در نهایت این سیستم به عنوان ابزاری برای تولید محتویات پیچیده طرف سرور مورد استفاده قرار گرفت. شرکت سان تلاش میکرد جاوا را به عنوان یک پلاتفرم برای اپلتهای طرف مشتری مطرح کند اما به دلایلی مانند عدم وجود یکپارچگی با محتوا (اپلتها به جعبههای کوچکی محدود میشدند که درون صفحه قرار داشتند) و عملکرد ضعیف (مخصوصاً شروع با تأخیر) ماشین مجازی بر روی سختافزارهای PCهای آن زمان این امر هرگز محقق نشد.
با این وجود، جاوا اسکریپت یک زبان برنامهنویسی اسکریپتی است که برای صفحات وب طراحی شده است. نسخه استاندارد آن ECMAScript نام دارد. اگر چه نام آن شبیه جاوا است اما توسط شرکت ارتباطات نت اسکیپ (Netscape) طراحی شده است و تقریباً هیچ ارتباطی با جاوا که ساخت شرکت میکروسیستمهای سان است ندارد. تنها شباهت آن با جاوا در این است که نحوه نگارش آن از زبان برنامه نویسی C گرفته شده است. جاوا اسکریپت مانند جاوا برنامه نویسی شیءگرا است اما شبیه سی پلاس پلاس و بر خلاف جاوا امکان استفاده از کدهای درهم (مخلوط) یعنی استفاده هم زمان از زبان برنامهنویسی شیء گرا و برنامهنویسی رویهای را فراهم میآورد. جاوا اسکریپت در کنار مدل شیء سند به زبان برنامهنویسی بسیار قویای تبدیل شده که حتی طراحان آن چنین تصوری از موفقیت آن نداشتند. گاهی اوقات در مورد آن از کلمه HTML پویا (DHTML) استفاده میشود تا گذر از صفحات HTML "ایستا" بیشتر حس میشود.
(برنامهنویسی) آجاکس یک فناوری مبتنی بر جاوا اسکریپت است که تأثیر زیادی بر شکلگیری تور جهان گستر داشته است. در این روش در زمانهای لازم، تنها بخشی از صفحه وب که مورد نیاز کاربر است به روز میشود تا سرعت کاربر بالاتر برود. آجاکس یکی از جنبههای مهم وب 2.0 محسوب میشود.
تأثیر بر روابط اجتماعی
وب در دنیای امروزی تبادل اطلاعات بین افراد در سراسر جهان را بسیار ساده و آسان نموده است و این امر با این حجم وسیع هرگز در تاریخ بشر سابقه نداشته است. افرادی که در گوشه و کنار جهان قرار دارند و هزاران کیلومتر از یکدیگر فاصله میتوانند افکار خود را به راحتی مبادله کنند و یا از روحیات و خط مشی زندگی خود با دیگران صحبت کنند. تجربههای عاطفی، عقاید سیاسی، رسوم فرهنگی، ضربالمثلهای ریتمدار، پندهای تجاری، کارهای هنری، تصاویر و عکسها، قطعات ادبی بدون هیچ سرمایهگذاری از جانب کاربر به راحتی در اختیار وی قرار میگیرد. اگر چه کارایی وب به فناوری مادی آن وابسته است اطلاعات موجود روی آن به شیوه کتابخانه و یا مطبوعات به صورت فیزیکی ارائه نمیشوند. بنابراین انتشارات اطلاعات از طریق وب اینترنت به کتابها و مجلههای فیزیکی و مادی محدود نمیشود و نیاز به کپی کردن فیزیکی اطلاعات وجود ندارد. اطلاعات موجود روی وب به صورت دیجیتال ارائه میشوند و بنابراین جستجو در آنها به سرعت زیادی صورت میگیرد. که بسیار سریعتر از جستجو در کتابخانه است و حتی فردی که در اینترنت جستجو میکند نسبت به فردی که از پست نامه، تلفن، تلگراف و یا وسایل ارتباطی دیگر استفاده میکند با سرعت بیشتری اطلاعات را بازیابی میکند.
وب مهمترین ابزار تبادل اطلاعات است که در کره زمین رونق فراوانی یافته است. این قابلیت به کاربران اجازه میدهد تا با افراد و گروههای مختلفی که در سراسر جهان پراکنده هستند و در فضا و مکان متفاوتی قرار دارند ارتباط برقرار کنند و نیاز به برقراری ارتباط فیزیکی میان افراد را مرتفع میسازد.
از آنجا که وب در سراسر جهان فعال است، عدهای آن را عامل ایجاد تفاهم میان افراد ساکن در سراسر جهان میدانند. وب پتانسیل فراوانی برای ایجاد روابط اجتماعی دارد و میتواند حس نوعدوستی و درک متقابل را افزایش دهد و یا حتی باعث شو که خشونت به صورت وسیعی رواج یابد و یا رژیمهای ظالم و عوام فریب به خواستههای خود که در طول تاریخ از دستیابی به آنها عاجز بودند بترسند.
امروزه در وب انواع مختلف اطلاعات را میتوان یافت و افرادی که تمایل دارند با جوامع و فرهنگهای مختلف آشنا شدند مراجعه به وب سادهترین راه است. اگر بخواهیم به شهری دور دست سفر کنید، وب بهترین مرجع ممکن برای یافتن اطلاعات مربوط به آن شهر است مخصوصاً اگر شهر مورد نظرتان در یکی از کشورهای توسعه نیافته قرار داشته باشد. روزنامههای محلی، مطبوعات دولتی و غیره از طریق اینترنت به راحتی قابل دسترسی هستند و به همین دلیل است که کاربران اینترنت روز به روز افزایش مییابند.
انتشار صفحات وب
صفحات وب در دسترس همه رسانههای جمعی قرار دارد. برای آنکه بتوانید یک صفحه وب را "منتشر" کنید لازم نیست به سراغ یک ناشر یا مؤسسه رسانهای که در سرتاسر جهان مشاهده میشوند بروید. ابر متن، برخلاف کتاب و اسناد، دارای یک نظم خطی از ابتدا تا انتها نیست. ابر متن به بخشهای فصل، زیر فصل و عناوین که در کتابها دیده میشود تقسیمبندی نمیشود.
اگر چه برخی از وب سایتها به چند زبان عرضه میشوند بسیاری از آنها فقط به یک زبان ارائه میشوند. همه برنامههای کامپیوتری همه کاراکترهای خاص و متون دو سویه RTL را در بر نمیگیرند. این عوامل این ادعا را که تور جهان گستر، جهان را به سمت یکپارچه شدن پیش میبرد به چالش میکشد. فرصت مناسب برای انتشار اطلاعات در صفحات وب شخصی و همچنین صفحات خانوادگی تجارتهای خرد و غیره توسط خدمات رایگان میزبانی وب به اوج خود رسیده است.
سرعت در وب
نگرانی موجود در مورد ازدحام اطلاعات روی زیر ساختار اینترنت و تأخیر زیاد در دسترسی به دادهها به باعث شده است که نام World Wide Web به "World Wide Wait" تغییر کند! افزایش سرعت اینترنت مسألهای مهم در بحثهای مربوط به استفاده از همتا سازی و کیفیت خدمات (QOS) است. راه حلهای ممکن برای کاهش انتظار برای مشاهده صفحات وب در سایت W3C ارائه شده است.
راهنمای استانداردهای موجود برای پاسخ زمانی ایدهآل صفحات وب (مطابق کتاب نیلسن، چاپ 1999، صفحه 42) عبارتند از:
1/0 ثانیه (یک دهم ثانیه). زمان ایدهآل پاسخ کاربر هیچ گونه تأخیری را حس نمیکند.
1 ثانیه. حداکثر زمان قابل قبول. زمان دانلود بیش از 1 ثانیه کاربر را خسته میکند.
10 ثانیه. زمان غیر قابل قبول. کاربر خسته شده و دوست دارد سایت را ترک کند. این اعداد برای طراحی ظرفیت سرور کاربرد زیادی دارند.
www در نامهای وبسایتها
از لحاظ فنی هیچ دلیلی وجود ندارد که نام سایت حتماً با www آغاز شود و اولین سرور وب در "info.cern.ch" قرار داشت. استفاده از پیشوند www یک توافق است که بین سازمانهای ارائه دهنده خدمات وب انجام شده است تا تمامی نامهای میزبان از یک پروتکل تبعیت کنند؛ برای مثال، بسیاری از سازمانها نام سرور اصلی پروتکل گوفر خرد را به صورت gopher.wherever.edu تعریف میکنند و از پیشوندهای دیگری استفاده میکنند تا بتوان از چندین سرور وب استفاده کنند. برخی از مرورگرها به صورت خودکار www را به ابتدا و ".com" را به انتهای URL تایپ شده اضافه میکنند. در مرورگرهای اینترنت اکسپلورر و فایرفاکس موزیلا با فشردن همزمان کلیدهای ctrl و Enter پیشوند "http://www." و پسوند "com." به انتهای URL اضافه میشوند.
تلفظ "www
در زبان انگلیسی، WWW طولانیترین تلفظ ممکن تور جهان گستر است که یک سرواژه سه حرفی است که به نه سیلاب نیاز دارد. داگلاس آدامز اظهار داشت: World Wide Web تنها عبارتی است که تلفظ شکل مختصر آن سه برابر بیشتر از تلفظ خود آن طول میکشد.
نسخههای کوتاهتر عبارتنداز "triple double 'u'"، "triple dub"، "dub dub dub"، "wuh wuh wuh" و "all the 'double u's". در زبانهای دیگر "WWW" را اغلب "VVV" تلفظ میکنند. در زبان چینی، World Wide Web را به صورت wàn wéi wǎng تلفظ میکنند (به چینی: 万维网) که به معنای "شبکه ده هزار بعدی" است.
تاریخچه وب جهان گستر
تیم برنرزلی در سال ۱۹۸۹ وقتی که اولین طرح پیشنهادی و طرح خود را به موسسهٔ سرن (پروهشگاه فیزیک هستهای و انرژیهای سطح بالا) در سویس بوردر فرانسه میفرستاد؛ اینترنت را اختراع کرد.
خصوصیات نسخههای مختلف وب
وب نسخهٔ یک: مستندات (توسط پیوندها-لینکها-) به هم مرتبط شدهاند.
وب نسخهٔ دو: محتویات توسط کاربران ایجاد میشود و اطلاعات بصورت پویا تولید و رشد پیدا میکنند.
وب نسخه سه: ارتباط دادهها، ابزار، و مردم در سراسر جهان(به وقوع میپیوندد).
این اختراع مثل تمام اخترعات بنیادی وب بر پایه سه تکنولوژی اصلی شکل گرفته:
آدرس یاب یا شناسه آدرس واحد (معروف URL یا URI) منبع مستندات یا اطلاعات در وب برای پیدا کردن آن مستند در کل وب.
زبان نشانه گذاری متن هوشمند (HTML) برای ارائه محتویات صفحات وب و برقراری پیوندها(لینکها).
پرتکل انتقال متن هوشمند (HTTP) برای انتقال اطلاعات وبی در سرتاسر اینترنت.
همان اوایل کار، خیلی زود تیم برنزلی متوجه شد که وب برای موفق بودن نیاز به عامل چهارمی و آن آزاد بودن و بازبودن (دسترسیها در) وب است. این تصمیم موثر، راه را برای رسید وب به وضعیت موجود امروز باز کرد که(باعث شد اینترنت:) جهانی، باز و آزاد، سازگار با سیستمهای عامل و سخت افزارهای متفاوت، یک مجموعه مرتبط با هم، آموزشی، تجاری، سرگرم کننده، رفاه آور برای مردم شدهاست.
وب ۱٫۰
در ابتدا داستان با شبکهای از مقالات و متنها شروع شد.
و مطمئناً در سال ۱۹۹۸ ارائه شدن گوگل با پیشنهاد الگوریتم جدید، بواسطه سادگی و توانایی خود در جستجو در اینترنت، بهبودی و پیشرفت قابل توجهی برای وب بود. موتور جستجوی گوگل انتظارات بعدی مصرف کنندگان که به دنبال پیدا کردن اطلاعات، محصولات و سرویسها و دیگر مردم بودند را بالا برد. همچنین گوگل سطح پذیرش راهبرد تجارت پیچیده تر و برنامه فروش آنلاین برای شرکتها را ارتقا داد(با این بهانه) که بتوانند رتبه خود را در گوگل بیشتر کنند (تا در اولین نتایج جستجوی گوگل قرار گیرند). این کار گوگل انقلاب جدیدی در بوجود آمدن کسب و کارهای آنلاین (حاضر در همه جا و همه وقت) و مدلهای جدید تبلیغات و همچنین بازارهای جدید را باعث شد.
بدین ترتیب وبلاگها دارای شخصیتی خواص برای خود شدند که این شخصیت را مستقیماً از مولف خود به ارث میبرند (شما با مطالعه دفترچه خاطرات شخصی هر فرد میتوانید با ابعاد متفاوت شخصیتی وی نیز تا اندازهای مه امکان دارد آشنا شوید
وب ۲٫۰
این اتفاقات ما را به وب ۲٫۰ رساند. در حالی که تجارتها و کسب و کارها داشتند از روشهای قبل به روشهای جدید وب مهاجرت میکردند یک نسل جدیدی از کاربران و برنامه نویسان وب شروع به همکاری فعالی کردند. در سال ۲۰۰۴ تیم اوریلی وب ۲٫۰ را با عنوان انقلاب تجارت در صنعت کامپیوتر بوسیله مهاجرت به روی بستر وب" را (به جهان)معرفی کرد. اصل قضیه وب ۲٫۰ این است که کاربرانی مثل خود مصرف کنندگان محتویات را ایجاد میکنند. و به این ترتیب اطلاعات خیلی پویاتر از اطلاعات در وب ۱٫۰ میباشد.
جامعه ویکیپدیا مفهوم همکاری و خرد جمعی جوامع مردمی وب ۲٫۰ را ارتقا داد. ویکیپدیا وب ۲٫۰ را اینگونه تعریف میکند:«عنوانی که روند استفاده از وب جهانگستر (www)و تکنولوژیها و طراحیهای آن که هدفش رسیدن به افزایش خلاقیت، اشتراک گذاشتن اطلاعات و مهمتر از همه همکاری کاربران است را توصیف میکند.» .
(در محدوده وب ۲٫۰) شرکتها باید تصمیم بگیرند که برای کارشان وبلاگ بسازند یا نسازند!، و اینکه به هر حال میخواهند نظر مشتریانشان در مورد محصولاتشان را به دیگران نشان بدهند یا خیر. شرکتها به سمت و سوی فعال سازی و کاربردی تر کردن نظرات مشتریانشان در کسب و کارشان هستند، تا بتوانند نیازمندیهای مشتریانشان و توقعات نحوه تعامل خرید و فروششان را بهتر برآورده سازند.
یوتیوب خیلی خوب به تعریف همکاری اجتماعات در وب ۲٫۰ کمک کرد. در آوریل ۲۰۰۸ موتور جستجوی یوتیوب ۸۰ میلیون پاسخ ارائه کرده که حدود ۴ میلیون از آنها کانالهای ایجاد شده توسط کاربران است.
به گفته شرکت بینالمللی اطلاعات(IDC)، ویدئوهای تولید شده توسط کاربران و آپلود شده در روز در تمام سایتهای فیلم بیش از ۵۰۰ هزار قطعه فیلم در سال ۲۰۰۷ بوده و در چهار سال بعد از آن به حدود ۵ میلیون (ویدئو در روز)خواهد شد.
چیزهای شگفت انگیزی در اینترنت اتفاق افتادهاست. به هر حال در موارد متعددی وب ۲٫۰ باز هم بصورت محدوده بستهای (به حساب میآید)، که در آن معمولاً پیوند دادنها داخل آن (برای نگه داشتن مصرف کنندگان و مشتریان)ساده نیست و هنوز در خارج از سایت مربوطه یا بین چند سایت مختلف باید صورت گیرد و بعضی اوقات نیر استفاده اختصاصی از راه حلها و ضمیههای بعد مانع همکاری و ارتباط میشود.
وب ۳٫۰
اگر نخواهیم بگوییم انقلاب، تحول بعدی در وب ارتباط سخت افزار(مثل موبایل، لپ تاپ، و سایر دستگاههای سخت افزاری)به اینترنت بود. راه جدیدی برای یکپارچه سازی و هموار کردن راههای بدست آوردن اطلاعات و دید جدیدی که قبلاً اصلاً امکان پذیر نبود. و راه جدیدی برای ارتباط به اینترنت از طریق دستگهای متنوعی که قابلیت و توانایی پیداکردن و تجزیه و تحلیل و شسته رفته کردن اطلاعات را دارند.
کنسرسیوم وب جهانگستر (w۳c)تکنولوژیهای جدیدی را برای به وقوع پیوستن وب ۳٫۰ استاندارد سازی کرد. که شامل عناوین: وب مفهومی، ویدئو روی وب، وب سیار و همراه و وب در همه جا و تمام شرایط میباشند.
وب مفهومی
وب مفهومی چارچوبی مشترک مبتنی بر آدرسهای اینترنتی بوجود آورد که اجازه میدهد در سرتاسر برنامهها، برنامههای بزرگ و محدودههای اجتماعی، اطلاعات به همدیگر مرتبط شوند، به اشتراک گذاشته شوند و قابلیت استفاده مجدد پیدا کنند. با استفاده از تکنولوژیهای کنسرسیوم جهانگستر(w۳c) در وب مفهومی افراد یا دستگاها میتوانند با استفاده از یک نمونه از اطلاعات از یک مجموعه به مجموعه بی انتهایی از اطلاعات مرتبط به آن مطلب که در پایگاهای اطلاعاتی سرتاسر جهان دستیابی کند. این پایگاها از طریق شبکه سخت افزاری و کابل کشی به هم مرتبط نشدهاند بلکه این اطلاعات پراکنده در مناطق مختلف جغرافیایی بوسیله پارامترهای مشترکی مانند: یک شخص خاص، یک مکان خاص، یک ایده و نظریه خاص، یک مفهوم خاص و.... به هم پیوند داه میشوند.
اهداف اصلی وب مفهومی
وب مفهومی، شبکهای از اطلاعات به هم مرتبط است. خیلی از اطلاعاتی که در طول روز آنها را از اینترنت استفاده میکنیم در یک جا نیستند. برای مثال شما صورتحساب بانکی خود را در اینترنت در سایت بانک مربوطه و عکسهای خود را در آلبوم اینترنتی در سایتی دیگر و قرار ملاقاتهای خود را باز در جایی دیگر میبینید. اما آیا میتوانید عکسهای خودتان را در تقویم خودتان ببینید و بفهمید کی آن عکس را گرفتهاید و در آن وقت چه میکردید؟ آیا میتوانید گزارشهای بانکی خود را در تقویم خود ببینید؟ چرا نه؟! چون شبکهای ازاطلاعات به هم مرتبط شده ندارید. چون هرکدام از اطلاعات شما بوسیله برنامهای خاص کنترل میشوند و در سایت خاصی نگهداری میشوند.
دیدگاه وب مفهومی این است که مبانی وب را از تکیه بر مستندات و فایلها به پایه ریزی بر اساس اطلاعات گسترش دهیم. اطلاعات یک مطلب باید بتوانند به مستندات مورد استفاده در معماری عمومی وب دسترسی داشته باشند، مثلاً آدرسهای اینترنتی باید قابلیت اتصال به مستند دیگر یا قسمت از آن را که در رابطه با همین موضوع است در حال حاضر ارتباط داشته باشند. این یعنی اینکه ایجاد یک چارچوب مشترکی که اجازه بدهد اطلاعات قابلیت اشتراک گذاری و استفاده مجدد در سرتاسر برنامهها، برنامههای خیلی بزرگ و محدودههای ارتباطی و اجتماعی بصورت اتوماتیک و خودکار با کیفیت و درستی ابزارهای دستی، که شامل قابلیت ایجاد ارتباطات جدید و قابل نمایش در میان اطلاعات باشد.
فضای مجازی مجتمع یا مجتمع فضای مجازی (محاسبات ابری-رایانش ابری)
مجتمع فضای مجازی یا فضای مجازی مجتمع چیست؟
تصورکنید کامپیوتر و تمام دستگاههای قابل حملتان (مثل موبایل و لپ تاپ و کتاب خوان و...) در تمام اوقات با هم همسان سازی شده باشند(sync سنکرون باشند). تصورکنید هر وقت که اراده کردید به تمام اطلاعات شخصی خودتان دسترسی پیدا کنید. تصورت کنید توانایی دسته بندی و سازماندهی و جستجوی تمام اطلاعاتتان را روی اینترنت داشته باشید. تصور کنید که بتوانید تمام اطلاعات خود را از قبیل عکس، فیلم، مطلب، ایمیل، فایلها و مدارک، و... را برای دوستان، فامیل، همکاران بصورت فوری به اشتراک بگذارید. همه اینها وعدهای مجتمع فضای مجازی شخصی است.
این مطلب را درک و باور کنید یا نه، به هر حال احتمالاً همین الآن در حال استفاده از یک سرویس مبتنی بر فضای مجازی مجتمع هستید. و تقریباً همه کسانی که با کامپیوتر کار میکنند. gmail و google docs دو نمونه اولیه از مجتمع فضای مجازی هستند که ما حتی فکرش را هم نمیکردیم که بر پایه همین نوع سرویس باشند.
بطور خلاصه، فضای مجازی مجتمع شخصی به این معنی است که: همه بخشهای اطلاعاتی که در طول زندگی و راجع به هرجنبه از زندگیتان در هروقت که نیاز داشته باشید دم دست شما و آماده برای استفاده شما هستند. اطلاعات باید سیار و همراه، قابل انتقال و در هر لحظه قابل دستیابی باشد. شاه کلید امکان پذیر شدن، قابلیت حمل و تعاملی شدن اطلاعاتتان همسان و به روز بودن اطلاعات شما در میان دستگاهها مورد استفاده شما(مانند لپ تاپ، موبایل و...)مثل اطلاعات به اشتراک گذاشته شده باشند. اطلاعات به اشتراک گذاشته شده، اطلاعاتی هستند که در هرجاکه اراده کنیم به آنها دسترسی پیدا میکنیم، مثل هر شبکههای اجتماعی مجازی، بانکها، وبلاگها، اتاقهای خبری، اجتماعات اقتصادی و غیره. نهایتاً، فضای مجازی مجمتمع شخصی که شامل همه اطلاعاتتان از دفترچه تلفن و آدرسهایتان گرفته تا کلکسیون آهنگها و صداها و مدارک و گزارشهای کاری و اقتصادی و.... به فضای مجازی مجتمع عمومی و فضای مجازی مجتمع دیگران متصل خواهد شد. همه چیز به هم متصل خواهد شد. این یعنی اینکه در هر جای اینترنت که با آن سرو کله دارید، مانند کار کردن با افراد دیگر، میتوانید به آن اطلاعات مورد نظرتان اتصال برقرار کنید. این قضیه شامل، شبکههای اجتماعی، بانکها، دانشگاهها، محلهای کاری، فامیل و دوستان خودتان هم میشود. مطمئناً، شما خواهید توانست که چه قسمتی از اطلاعات شما عمومی و چه قسمتی بصورت خصوصی بماند. دستهای از فضای مجازی مجتمع شخصی، شکل جدیدی از شبکههای اجتماعی مجازی را شکل خواهند داد که تنظیمات حریم شخصی بیشتری از امثال فیس بوک خواهند داشت، و ویژه تر خواهند شد اگر این دسته بندیها فامیل محور یا تجارت گرا باشند.(حریم شخصی مسئله بزرگ آمار جرم در فضای مجازی مجتمع افراد خواهد شد). سرانجام، ابزارها ودستگاههای شما(در فضای مجازی مجتمع)، درباره شما یاد می گیرند و می فهمند شما چه کار میکنید، به کجا میروید و قصد انجام چه کاری را دارید و قتی شما به سراغ آنها میروید. ممکنه این نظرات شبیه داستانهای علمی تخیلی به نظر برسد، اما مطمئناً ما را به سمتی فضای مجازی مجتمع سوق خواهد داد. هرچند هنوز کاملاً وجود ندارد. ما در حال ایجاد فضای مجازی مجتمع شخصیمان هستیم.
فضای مجازی مجتمع شخصی شما
فضای مجازی مجتمع شخصی راهی برای ارتباط تجربههای کاربران، همگرایی(و متمرکزشدن و یکی شدن) تکنولوژها با دستگاهها و سخت افزارهایی که از سیستم عاملهای مشابهی استفاده میکنند، شبکههای به هم مرتبط (مانندشبکههای رادیویی)است. اما با وجود همگرایی تکنولوژیها، سخت افزارها به سمت تنوع و واگرایی بیشتر میل میکنند. چالش بعدی این است که بفهمیم چگونه در سرتاسر این تنوع دستگاهها بصورت مستمر ارتباط برقرار کنیم. مجتمع سازی(محاسبات ابری) امروزی در میان کل تولیدات یک شرکت بخصوص بصورت خیلی خوبی سنکرون اطلاعات(همسان سازی و همزمان سازی)و مطالب صورت گرفتهاست. با پیش زمینه فضای مجازی مجتمع شخصی، مصرف کنندگان میتوانند پخش کنند: آهنگ، تصاویر، محصولات و چیزهای خیلی زیادتری از هر مطلبی که امکان دسترسی به آن را دارند و از هر دستگاه سخت افزاری که دارند و هرجا که اتفاق میافتد، را داشته باشند.
سرویسهای «فضای مجازی مجتمع»از چه چیزیهای تشکیل میشوند
راه تولید کنندگان و تحلیل گران نشان میدهد که فضای مجازی مجتمع در تمام نقاط جهان بصورت پراکندهاست. برخی از ابهامات در جو تجارت و برخی در هنگام مشخص شدن برخی اشکالات فنی است. وقتی (الکی)به هرچیزی برچسب فضای مجازی مجتمع بچسبانند، این اصطلاح معنی خودش را از دست میدهد و به عبارت دیگر لوث میشود.
شرکت بینالمللی اطلاعات کامپیوتر(IDC) با لیست دم دستی بدرد بخوری آمده تا تعیین کند چه چیزهای را میشود برچسب فضای مجازی مجتمع زد و چه چیزهای را نه؟!
مشخصات کلیدی سرویسهای «فضای مجازی مجتمع
اطلاعات بوسیله شخص ثالث، خارج از محدوده سایت ایجاد شده باشد.
بوسیله اینترنت قابلیت دسترسی داشته باشد.
حداقل یا هیچ فرد ماهر در زمینه فناوری اطلاعات برای پیاده سازی آن نباشد.
تامین کننده باشد: یعنی خودش تامین کننده نیازهای درخواستها باشد، تقریباً همزمان استقرار پیدا کند(همزمان در اینترنت و دستگاههای متصل به آن، لپ تاپ و پخش کنندهها و کامپیوتر هیا شخصی و...)، بصورت پویا و خوب دسته بندی شود
مدل قیمت گذاری داشته باشد: بصورت خوب دسته بندی شود، کاربردی باشد(مبتنی براستفاده کاربر باشد)(حداقل قابلیت انتخاب داشته باشد).
رابط کاربر خوب داشته باشد(قابلیت نمایش در مرورگر و جانشین داشته باشد. به قول معروف Userfriendly باشد).
رابط سیستم داشته باشد: توابع کتابخانهای وب سرویسی داشته باشد.
قابلیت اشتراک گذاری منابع یا نسخههای مشترک را داشته باشد(قابلیت سفارشی کردن در حیطه سرویسهای اشتراک گذاری).
علوم وب
علوم وب (Web science) به آن دسته از تلاشها و مطالعات علمی اطلاق میشود که به منظور صوریسازی و یکپارچهنمایی ابعاد گوناگون اجتماعی و مهندسی کاربردهای مبتنی بر همکاری تحت شبکههای بزرگمقیاس محاسباتی همچون وب جهانشمول صورت میگیرد.
صفحه وب
صفحهٔ وب (به انگلیسی: Web page) یک منبع اطلاعاتی مناسب وب جهانگستر است و میتوان با یک مرورگر وب به آن دسترسی یافت. این اطلاعات بیشتر در قالب اچتیامال یا اکساچتیامال هستند و میتوان با بهره از پیوندهای بسمتن (Hypertext) از یک صفحهٔ وب به صفحههای دیگر رسید.
صفحههای وب میتوانند از یک رایانهٔ محلی و یا از یک کارساز (سرویسدهنده) وب دریافت شوند. کارساز وب میتواند دسترسی به شبکهٔ خصوصی را محدود کند.
وب معنایی
وب معنایی یک جنبش مشترک است که توسط w۳c رهبری می شود که فرمت های رایج داده را روی شبکه گسترده جهانی ترویج می کند. با تشویق به گنجاندن محتوی معنایی در صفحات وب، وب معنایی به تبدیل شدن وب حاضر مشتمل بر اسناد ساختار نایافته به یک "وبی از داده ها" کمک می کند. این در چارچوب شرح منابع (RDF) از w۳c ساخته می شود.
بنابر w۳c، " وب معنایی یک چارچوب مشترک فراهم می آورد که اجازه می دهد داده ها به اشتراک گذاشته شوند و در سراسر مرزهای کاربردی، اقتصادی و اجتماعی دوباره استفاده شوند."
این واژه توسط تیم برنزلی،مخترع وب گسترده جهانی و گرداننده w۳c،ابداع شد که هم اکنون بر توسعه استانداردهای مطرح شده وب معنایی نظارت دارد. او وب معنایی را این گونه معنی کرد که " تارنمایی از داده که می تواند مستقیم و غیر مسقیم توسط ماشین مورد پردازش قرار بگیرد. " درحالی که منتقدان پرسش هایی درباره امکان پذیر بودن آن دارند، طرفداران استدلال می کنند که برنامه های کاربردی در صنعت، زیست شناسی و تحقیقات علوم انسانی، در حال حاضر، اعتبار مفهوم اصلی را ثابت کرده است.
تاریخچه
مفهوم مدل شبکه معنایی در اوایل دهه شصت توسط دانشمند شناختیAllan M.Collins، زبان شناس M. Ross Quillian و روان شناس Elizabeth F.Loftus در نشریات مختلف به عنوان یک فرم برای نمایش دادن دانش ساخت یافته معنایی، ابداع شد. با قراردادن ابرداده قابل خواندن توسط ماشین ،درباره صفحات و چگونگی ارتباط آن ها با یکدیگر، فعال کردن عامل های خودکارشده برای دسترسی هوشمندانه تر وب و انجام وظایف از طرف کاربران موجب گسترش یافتن شبکه صفحات وب ابرپیوند شده که تنها توسط انسان قابل خواندن بود، شد.
خیلی از فناوری هایی که توسط w۳c مطرح شده است قبل از این که زیر چتر w۳cقرار بگیرند، وجود داشته اند. این ها در زمینه های مختلف استفاده شده است، به خصوص برخورد با اطلاعاتی است که شامل یک دامنه محدود و تعریف شده است، و جایی که داده به اشتراک گذاشته شده یک نیاز مشترک است، مانند تحقیقات علمی یا داده های تبدیل شده مابین کسب و کارها. به علاوه، فناوری هایی با هدف مشترک ، مانند microformat ها، ظهور کرده اند.
هدف
اصلی ترین هدف وب معنایی قادر ساختن کاربران برای پیداکردن، اشتراک گذاشتن و راحت تر ترکیب کردن اطلاعات جهت تکامل بخشیدن وب حاضر است. انسان ها توانایی استفاده از وب را برای پیش بردن وظایفی مانند پیدا کردن معادل ایرلندی کلمه "پوشه"، رزرو کردن یک کتاب از کتابخانه و جستجو برای پایین ترین قیمت یک DVD را دارند. به هرحال، ماشین ها نمی توانند تمام این وظایف را بدون دستورالعمل انسان انجام دهند، چرا که صفحات وب طوری طراحی شده اند که توسط مردم خوانده شود، نه ماشین ها. وب معنایی یک چشم انداز از اطلاعات است که می تواند به آسانی توسط ماشین تفسیر شود، بنابرین ماشین ها می توانند بسیاری از کارهای خسته کننده شامل پیداکردن، ترکیب کردن و اقدام بر اساس اطلاعات بر روی وب را انجام دهند. وب معنایی، همان طور که در ابتدا پیش بینی می شد، سیستمی است که ماشین ها را به کار می اندازد که "بفهمند" و به درخواست های پیچیده انسان براساس معنای آن ها پاسخ دهند. چنین "فهمیدن" مستلزم آن است که منابع اطلاعاتی مربوطه به طور معنایی ساختار یافته شوند،یک کار چالش برانگیز. تیم برنز لی در ابتدا چشم انداز وب معنایی را این گونه توصیف کرد:
من رویایی دارم برای وب که در آن کامپیوتر ها توانایی تحلیل تمام داده های روی وب، مثل محتوی،پیوندها و تراکنش های بین مردم و کامپیوتر ها را دارند. یک وب معنایی، که این امر را ممکن می سازد، فعلا در حال ظهور است، اما زمانی که کامل شود، روال های روزانه تجارت ، بروکراسی و زندگی روزمره ما توسط گفتگوی بین ماشین ها انجام می شود. عامل های هوشمند بین مردم برای دوره ای که نهایتا این امر محقق شود تبلیغ می کنند.
وب معنایی به عنوان یک جمع کننده بین تمام محتوی مختلف،سیستم ها و برنامه های کاربردی اطلاعاتی در نظر گرفته شده است. برنامه های کاربردی در زمینه نشر، وبلاگ نویسی و خیلی سطوح دیگر وجود دارد.
معمولا واژه های معناشناسی، ابرداده، هستی شناسی و وب معنایی متناقض استفاده می شوند. به طور خاص، این واژه ها به عنوان کلمات فنی هر روز توسط محققین و پزشکان،جهت پوشش یک گستره وسیعی از زمینه های مختلف فن آوری، مفاهیم و سطوح برنامه های کاربردی استفاده می شوند. به علاوه، با توجه به وضعیت فعلی، نسبت به فعال کردن فناوری هایی که برای تحقق وب معنایی پیش بینی می شد، سردرگمی وجود دارد. در یک مقاله که توسط Greber,Barnard, Van der Merwe ارائه شد، چشم انداز وب معنایی جدول بندی شده و خلاصه ای از واژگان و فناوری های راه انداز ارائه شده است. مدل معماری مطرح شده توسط تیم برنزلی به عنوان مبنایی که مدل وضعیت فناوری های حال حاضر و در حال ظهور را ارائه می کند، استفاده می شود.
محدودیت های HTML
بسیاری از فایل های روی یک کامپیوتر معمولی را می توان آزادانه به اسناد قابل خواندن توسط انسان و داده های قابل خواندن برای ماشین تقسیم کرد. اسناد مثل پیام نامه ها، گزارشات و بروشورها توسط انسان خوانده می شود. داده، مثل تقویم، دفترچه آدرس،لیست پخش و صفحات گسترده از یک برنامه کاربردی برای نمایش، جستجو و ترکیب در حالات مختلف استفاده می کنند.
در حال حاضر، تارنمای گسترده جهانی عمدتا بر مبنای اسنادی است که با HTML نوشته شده است، یک استاندارد نشانه گذاری که برای کدینگ مجموعه ای از متن در خلال عناصر چند رسانه ای مانند تصاویر و فرم های تعاملی استفاده شده است. تگ های ابر داده روشی را فراهم می آورد که هر کامپیوتر می تواند محتوی صفحات وب را دسته بندی کند . برای مثال :
<meta name="keywords" content="computing, computer studies, computer">
<meta name="description" content="Cheap widgets for sale">
<meta name="author" content="John Doe">
با HTML و ابزاری برای نمایش خروجی آن (مثل مرورگر های وب) هرکسی می تواند صفحه ای برای لیست کردن مواردی برای فروش، بسازد و نمایش دهد. HTML این صفحه کاتالوگ می تواند اظهاراتی از قبیل "عنوان این سند سوپرمارکت ویجت است" را به ما بدهد، اما این ظرفیت در HTML نیست که واضح اظهار کند که مثلا کالا شماره X586172 یک Acme Gizmo است با قیمت خرده فروشی €199 ، یا این که یک کالای برای مصرف کننده است. بلکه ،HTML می تواند تنها بگوید که محدوده متن " X586172" چیزی است که باید نزدیک Acme" Gizmo" و "€199" قرار می گیرد. هیچ راهی وجود ندارد که بگوید "این یک کاتالوگ است" یا حتی تصدیق کردن این که "Acme Gizmo" بخشی از عنوان است یا "€199" یک قیمت است. همچنین هیچ راهی وجود ندارد که توصیف کند این تکه های از اطلاعات کنار هم قرار گرفته اند تا یک مورد را جدا از موارد دیگری که احتمالا در صفحه قرار دارند، توصیف کند.
HTML معنایی اشاره به عمل HTML سنتی در قصد نشانه گذاری ها دارد به جای این که مستقیما جزئیات چینش را مشخص کند. برای مثال کاربرد <em> برای نشان دادن "تاکید" است، بیشتر از <i> که ایتالیک شدن را مشخص می کند. جزئیات چینش در ترکیب با CSS ها در سمت مرورگر است. اما این عمل برای مشخص کردن معانی عناصر مثل موارد فروش و قیمت ناکارآمد است.
Microformat ها تلاش های غیر رسمی گسترش تگ های HTML را برای ایجاد نشانه گذاری معنایی قابل خواندن برای ماشین درباره عناصری مثل فروشگاه های خرده فروشی و موارد برای فروش را نشان می دهد.
راهکارهای وب معنایی
وب معنایی راه کارهای اضافه تری دارد که شامل نشر زبان هایی که مختص داده طراحی شده اند، مثل چهارچوب شرح منابع(RDF)، زبان هستی شناسی وب(OWL) و زبان نشانه گذاری توسعه پذیر(XML)، می شود. HTML اسناد و پیوند های بین آن ها را توصیف می کند. RDF،OWL وXML ،با تضاد،می توانند اشیا دلخواه را از قبیل مردم، دیدارها یا قطعات هواپیما توصیف کنند.
این فناوری ها به منظور فراهم آوردن شرحی که محتوی اسناد وب را تکمیل یا جایگزین کند، ترکیب شده اند. بنابرین، محتوی ممکن است به عنوان داده های توصیفی ذخیره شده در پایگاه داده های قابل دسترس وب ، یا نشانه گذاری دربین اسناد بروز کند(خصوصا، در HTML توسعه پذیر(XHTML) با XML پراکنده ، یا اغلب مواقع خالص در XML، با چینش یا ). توضیحات قابل خواندن برای ماشین، مدیران محتوی را به کار می اندازند تا معنی به محتوی اضافه کنند که توصیف کند ساختار دانشی که ما درباره محتوی داریم. در همین راستا، یک ماشین می تواند خودش دانش را ، به جای متن، با استفاده از پردازشی شبیه به استنتاج و استقرا انسان پردازش کند، در نتیجه نتایج معنی دار بیشتری به دست می آورد و به کامپیوتر ها برای اجرا خودکار جمع آوری اطلاعات و پژوهش کمک می کند.
چالش ها
برخی
از چالش های وب معنایی شامل وسعت، ابهام، تردید، تناقض و فریب. سیستم های استدلال کننده خودکار مجبور خواهد بود با تمام این مسائل مقابله کند به جای این که وعده وب معنایی را ارئه دهد.
وسعت : تارنمای گسترده جهانی شامل میلیاردها صفحه شده است. SNOMED CT هستی شناسی واژه شناسی پزشکی به تنهایی شامل 370,000 نام کلاس است و فناوری موجود هنوز قادر نبوده است که واژهای تکراری از جهت معنا را ازبین ببرد. هر سیستم استدلال کننده خودکاری مجبور است با ورودی های واقعا بزرگ مفابله کند.
ابهام : وجوه مبهمی مانند "جوان" و "بلند" وجود دارد. این ناشی می شود از ابهام درخواست کاربران، از وجوه ارائه شده توسط گردآورندگان محتوی، از انطباق واژه های درخواست با واژه های گرداورندگان و از تلاش برای ترکیب مبانی دانش های مختلف با وجوه مشترک ولی جنبه های متفاوت. منطق فازی رایج ترین تکنیک برای مقابله با ابهام است.
عدم قطعیت : وجوه دقیقی با ارزش های مشکوک وجود دارد. برای مثال، یک بیمار ممکن است مجموعه ای از علائم را که هرکدام متناظر با تشخیص مشخص و احتمال متفاوت باشد، را ارائه کند. روش های استدلال احتمالاتی به طور کلی کار برای رسیدگی به عدم قطعیت است.
تناقض : تناقضات منطقی ای وجود دارد که به ناچار در طول توسعه هستی شناسی بزرگ، و زمانی که هستی شناسی ها از منابع جدا با هم ترکیب شده اند، بوجود خواهد آمد. استدلال استقرایی یا قیاسی با شکست روبروست وقتی با تناقض مواجه است، زیرا "هر چیزی به دنبال یک تناقض" است. استدلال فسخ کردنی و استدلال paraconsistent، دو روش است که می تواند برای مقابله با تناقض به کار رود.
فریب : زمانی رخ می دهد که تهیه کننده اطلاعات عمدا مصرف کننده اطلاعات را گمراه کند. تکنیک های رمز نگاری در حال حاضر برای کاهش این تهدید مورد استفاده قرار می گیرند.
این لیست چالش ها بیش از این که کامل باشد، روشنگر است و روی چالش های لایه های "منطق وحدت" و "برهان" از وب معنایی، تمرکز دارد .گزارش آخر گروه رشد برای استدلال عدم قطعیت W3C، تمام این مشکلات را تحت عنوان "عدم قطعیت" جمع کرد. خیلی از تکنیک های ذکر شده در اینجا الحاقاتی نیاز خواهند داشت به زبان هستی شناسی وب مثلا برای حاشیه نویسی احتمالات شرطی.این منطقه از پژوهش فعال است.
استانداردها
استانداردسازی وب معنایی در وب3 تحت پوشش W3C می باشد.
اجزا
واژه "وب معنایی" معمولا استفاده می شود برای اشاره به فرمت ها و فناوری هایی که آنرا به کار می اندازند.جمع آوری، ساختاربندی و بازیابی داده های پیوندشده با فناوری ها یی که یک توضیح رسمی از وجوه،واژه ها و روابط در خلال یک دامنه دانش داده شده فراهم می آورد. این فن آوری ها طبق استانداردهای W3C مشخص شده اند و شامل این موارد می شود :
چارچوب تشریح منابع (RDF) یک روش عمومی برای توصیف اطلاعات
شمای RDF (RDFS)
سیستم سازمانی دانش ساده (SKOS)
SPARQL یک زبان پرس و جوی RDF
نشان گذاری3 (N3)، طراحی شده با توانایی خواندن انسان در ذهن
N-Triples، فرمتی برای ذخیره کردن و انتقال داده
لاک پشتسه تایی(زبان RDF سه مختصر و مفید)
زبان هستی شناسی وب(OWL)، یک خانواده از زبان های ارائه دانش
پشته وب معنایی روشنگر معماری وب معنایی است. توابع و روابط اجزا می تواند به صورت زیر خلاصه شود :
XML یک گرامر عنصری برای ساختار محتوی داخل اسناد فراهم می آورد.XML در حال حاضر یکی از اجزا لازم فناوری های وب معنایی در خیلی از موارد نیست، به عنوان جایگزین گرانرهای موجود، از قبیل لاک پشت. لاک پشت یک استاندارد بالفعل است اما از طریق یک فرآیند استاندارد رسمی نبوده است.
شمای XML یک زبان برای فراهم آوردن و محدود کردن ساختار و محتوی عناصری است که در اسناد XML وجود دارند.
RDF یک زبان ساده برای توصیف مدل های داده است که به اشیا ("منابع") و روابطشان اشاره دارد. یک مدل برپایه RDFمی تواند در گرامرهای مختلفی ارائه شود، مثل RDF/XML،N3،لاک پشت و RDFa. RDF یک استاندارد پایه ای از وب معنایی است.
شما RDF، RDF را توسعه داده است و یک لغت برای توصیف ویژگی ها و کلاس های منابع بر پایه RDF، با معانی برای تعمیم سلسله مراتب از خواص و طبقات است.
OWL لغات بیشتری برای توصیف ویژگی ها و کلاس ها اضافه می کند: از بین آن ها،روابط بین کلاس ها(disjointness)، cardinality(برای مثال "دقیقا یک" )، برابری،نوع سازی غنی تر از ویژگی ها، مشخصات ویژگی ها وشمارش کلاس ها.
SPARQL یک پروتکل و زبان کوئری از مبانع وب معنایی است.
وضعیت فعلی استاندارد سازی
استاندارد سازی های در حال پیشرفت فعلی شامل :
قانون فرمت تبادل(RIF) به عنوان لایه ای از پشته وب معنایی.
لایه هایی که هایی که هنوز به طور کامل بیرون نیامده اند شامل :
لایه های منطق وحدت و مدرک تحت تحقیقات فعال هستند.
مقصود بالابردن قابلیت استفاده و فایده وب است و ارتباط تنگاتنگ آن با منابع از طریق :
سرورهایی سیستم های داده ای موجود را با استفاده از RDF و SPARQL نشان می دهند.خیلی تبدیل کننده ها به RDF از برنامه های کاربردی مختلف وجود دارد.پایگاه داده های رابطه ای یک منبع مهم هستند. سرور وب معنایی بدون تاثیر گذاری بر عملکرد سیستم موجود به آن پیوست می شود.
اسناد "نشانه گداری شده" با اطلاعات معنایی(یک توسعه از تگ <meta>در HTML در صفحات وب امروزی برای تامین اطلاعات موتورهای جستجوی وب، با استفاده از وب خزنده، به کاربرده می شود). این می تواند اطلاعات قابل فهم برای ماشین درباره محتوی اسناد قابل فهم برای انسان باشد(از قبیل تولید کننده،عنوان،توضیحات اسناد) یا می تواند صرفا ابرداده نمایش دهنده مجموعه ای از حقایق باشد(از قبیل منابع و خدمات در هرکجای سایت ها).(توجه کنید که هرچیزی که بتواند با شناسه منبع یکنواخت شناسایی (URI) شود، می تواند توصیف شود، بنابرین وب معنایی می تواند درباره حیوانات،مردم،اماکن،ایده ها استدلال کند.) نشانه گذاری معنایی معمولا خودکار، تا به صورت دستی، تولید می شود.
واژگان ابرداده رایج(هستی شناسی ها) و نگاشت بین واژگان که به خالقان اسناد اجازه می دهد بدانند که چگونه اسنادشان را نشانه گذاری کنند، بنابرین عامل ها می توانند اطلاعات در ابرداده تامین شده را استفاده کنند( بنابرین مولف درمقام 'مولف صفحه' با مولف در مقام مولف کتابی که موضوع مرور یک کتاب است، اشتباه گرفته نمی شود. )
عامل های خودکارشده برای اجرای وظایف برای کاربران وب معنایی با استفاده از این داده
خدمات برپایه وب(معمولا با عامل های خودشان) برای تامین اطلاعات مخصوص عامل ها(برای مثال یک خدمت مورد اعتماد که یک عامل بتواند درباره تاریخچه خدمات ضعیف یا هرزه نگاری برخی فروشگاه های برخط بپرسد)
واکنش های شکاک
امکان سنجی عملی
منتقدان شدنی بودن تحقق کامل یا جزئی وب معنایی را می پرسند.بحران Cory Doctorow ("ابرچرند") از دورنمای رفتار انسان و ارجحییات شخصی هست. برای مثال، مردم ممکن است برای گمراه کردن موتور های وب معنایی که فرض را بر صحت ابرداده می گذارند، ابرداده جعلی به صفحات وب وارد کنند. این پدیده در ابرتگ ها شناخته شده بود که الگوریتم رتبه بندی آلتاویستا را با بالابردن رتبه صفحات وب بخصوص فریب می داد : موتور شاخص گذاری گوگل خصوصا به دنبال چنین تلاش هایی برای دست کاری است. Peter Gärdenfors و Timo Honkela اشاره می کنند که فناوری های وب معنایی برپایه منطق، تنها یکسری از پدیده های مربوط به هستی شناسی را پوشش می دهند.
جایی که فناوری های وب معنایی درجه پذیرش عملی بالاتری پیدا کرد، تمایل بیشتری به بودن آن در هسته جوامع تخصصی و سازمان های برای پروژه های درون سازمانی است. محدودیت ها به سوی پذیرش عملی، در دامنه ها و حوزه های محدود تر از چالش کمتری نسبت به عامه مردم و تارنمای گسترده جهانی دارد.
پتانسیل یک ایده در حال پیشرفت سریع
مقاله ابتکاری Scientific American در سال 2001 توسط برنزلی تکامل مورد انتظار از وب موجود به وب معنایی را توصیف کرد . یک تکامل کامل چنان که توسط برنزلی توصیف شد فعلا در حال اتفاق افتادن است. در 2006 برنزلی و همکارانش اظهار داشتند که : "این ایده ساده، به هر حال، تا حد زیادی تحقق نیافته باقی مانده است. " در حالی که ایده هنوز در حال ساخت است، به نظر می رسد به سرعت در حال تکامل است و الهام بخش بسیاری بوده است. بین 2007-2010 بسیاری محققان پتانسیل اجتماعی وب معنایی را در کسب و کار و بخش سلامت و برای شبکه سازی اجتماعی، بررسی کرده اند. آنها همچنین مرز تکامل دموکراسی را بررسی کرده اند: چگونه یک جامعه خواست مشترکش را به یک شیوه دموکراتیک از طریق وب معنایی فرم می دهد.
سانسور و حفظ حریم خصوصی
اشتیاق درباره وب معنایی می تواند با نگرانی ها درمورد سانسور و حفظ حریم خصوصی تعدیل شود. برای مثال، فناوری های تحلیل متن حالا می توانند با استفاده از کلمات دیگر به راحتی کنار گذاشته شود، مثلا استعاره ها، یا با استفاده از تصاویر به جای متن. یک اجرا حرفه ای از وب معنایی کنترل بر روی مشاهد و آفرینش اطلاعات آنلاین را برای دولت ها بسیار آسان تر می کند؛ چرا که فهمیدن این اطلاعات برای یک ماشین مسدود کننده محتوی خودکار، راحت تر است. به علاوه،این مسئله مطرح شده است که با استفاده از فایل های FOAF و ابرداده منطقه جغرافیایی، کمتر کسی حاضر به فاش شدن نامش در نگارش یک مقاله در یک وبلاگ شخصی خواهد شد. برخی از این نگرانی ها درخطاب به پروژه "وب آگاه سیاسی" بودند و یک عنوان فعال تحقیق و توسعه ای هستند.
دوبرابر شدن فرمت های خروجی
انتقاد دیگر به وب معنایی این است که زمان بیشتری صرف ساخت و انتشار محتوی می شود، چرا که برای یک تکه از داده به دو فرمت نیاز است: یکی برای نمایش انسان و یکی برای ماشین ها. به هرحال، بسیاری از برنامه های کاربردی در حال توسعه وب، در حال پرداختن به این موضوع از طریق ایجاد یک فرمت قابل خواندن برای ماشین پس از انتشار داده یا درخواست ماشین برای پنین داده هستند. توسعه microformat ها واکنشی دیگر به این نوع از انتقاد است. یکی دیگر از استدلال ها در دفاع از امکان سنجی وب معنایی، احتمالا قیمت در حال سقوط وظایف هوش انسانی در بازار کار دیجیتال،مثلAmazon Mechanical Turk است.
مشخصات از قبیل eRDF و RDFa، به داده های دلخواه RDF اجازه می دهد در صفحات HTML تعبیه بشوند.مکانیزم GRDDL (خوشه چین توضیحات منابع از گویش های زبان) به ماده موجود (شامل میکرو فرمت ها) اجازه می دهد به طور خودکار به عنوان RDF تفسیر شوند؛ بنابرین ناشران تنها نیاز به استفاده از یک فرمت،مثل HTML، را دارند.
پروژه ها
این بخش بعضی از پروژه ها و ابزار بسیاری را که جهت ایجاد راه حل های وب معنایی وجود دارد لیست می کند:
FOAF
یک واژه پرطرفدار در وب معنایی دوستِ دوست است که از RDF برای توصیف روابط مردم با دیگر مردم در "چیزهای" اطراف آن ها، استفاده می کند.FOAF به عامل های هوشمند، برای درک هزاران ارتباطی که مردم با یکدیگر دارند،مشاغل آن ها و موارد مهم در زندگی آنها، مجوز می دهد؛ ارتباطاتی که ممکن است در موتورهای جستتجوی سنتی برشمرده بشود یا نشود. زیرا ارتباطات از لحاظ تعداد بسیار گسترده است و تفسیر انسان از این اطلاعات ممکن است بهترین راه برای تحلیل آن ها نباشد.
FOAF یک مثال از چگونگی تلاش وب معنایی برای استفاده از ارتباطات در زمینه اجتماعی است.
SIOC
پروژه جوامع آنلاین معنایی پیوسته (SIOC،"شاک" تلفظ می شود) یک واژگان از اصطلاحات و روابط را که فضاهای داده وب را مدل می کند، فراهم می آورد. مثال هایی از این نوع فضاهای داده شامل : تالارهای گفتگو،بلاگ ها،پست های بلاگ/خبرخوان ها،لیست های پستی، به اشتراک گذاری بوک مارک ها و گالری عکس ها، می شود.
NextBIO
یک پایگاه داده تقویت کننده علوم زیستی بالا تجربی داده های تگ شده و با استفاده از هستی شناسی پزشکی مرتبط شده اند. NextBio با استفاده از یک رابط موتور جستجو قابل دسترسی است. محققان می توانند یافته های خود را برای الحاق به پایگاه داده کمک کنند. پایگاه داده در حال حاضر از توضیحات داده پروتئین و ژن و توالی داده های محوری پشتیبانی می کند و به طور پیوسته در حال گسترش برای حمایت از انواع دیگر داده های بیولوژیکی است.
برنامه کاربردی وب
برنامه کاربردی وب (به انگلیسی: web application) یک برنامهاست که میتوان به آن از طریق اینترنت یا اینترانت دسترسی داشت. همچنین به معنی یک برنامهایست که توسط یک مرورگر پشتیبانی میشود.(همانند افزونه جاوا) یا درون یک زبان برنامهنویسی نوشته شدهاست که توسط مرورگر پشتیبانی میشود؛ همانند جاوا اسکریپت که با زبان اچتیامال ترکیب شدهاست.
برنامههای وبی معمولا از مرورگرها به عنوان بستر فعالیت استفاده میکنند. یک مرورگر همانند یک کارخواه یا به عبارت بهتر یک کارخواه مختصر است که کاربر را قادر به به روزرسانی و استفاده از برنامه میکند، بدون این که احتیاج باشد کاربر برنامه را بر روی دستگاه خود نصب کند.
keywords : آمار,علم آمار,احتمالات,اندازه گیری,رایانه,متغیر