شناسانه منبع یکسان

شناسانهٔ منبع یکسان^[۱] (به انگلیسی: Uniform Resource Identifier) با کوته‌نوشت یوآرآی (به انگلیسی: URI) رشته‌ای از نویسه‌ها است که به صورت غیر مبهم یک منبع به‌خصوص را شناسایی می‌کند. برای اطمینان از یکسان بودن، همهٔ URIها باید از مجموعه قواعد نحوی از پیش تعیین شده‌ای پیروی کنند^[۲]، اما گسترش پذیری از طریق طرح نامگذاری سلسله مراتبی که به صورت مجزا تعریف می‌شود (مثل http://) قابل انجام است.^[۳]

این شناسایی (URI)، تعامل با نمایش‌های منبع روی یک شبکه (معمولا وب جهان‌گستر) توسط پروتکل‌های خاص را ممکن می‌سازد. نقش طرح‌ها، تعیین ترکیب نحوی به‌خصوص و پروتکل مرتبطی که هر URI را تعریف می‌کند، می‌باشد. معروف‌ترین قالب یک URI مکان‌یاب منبع یکسان (URL) است، که به صورت معمول و به صورت غیررسمی «نشانی وب»^[۴] نامیده می‌شود. مفهوم «نام منبع یکسان» (URN) که در عمل کمتر دیده می‌شود، برای تکمیل URLها از طریق فراهم کردن سازوکاری برای شناسایی منابع در فضای نام به‌خصوص، می‌باشد.^[۳]

ترکیب نحوی همگانی

تعریف

هر URI با یک نام «برنامه واکشی» (طرح) شروع می‌شوند، که به مشخصات برای شناسه‌های منتسب شده در آن طرح ارجاع دارد. ترکیب نحوی URI یک سیستم نامگذاری هم‌عهد شده و قابل گسترش است که در آن هر مشخصات طرح می‌تواند ترکیب نحوی و معنای شناسه‌هایی که از آن طرح استفاده می‌کنند را تعیین کند. ترکیب نحوی همگانی URI یک فرامجموعه از ترکیب نحوی برای همهٔ طرح‌های URI می‌باشد. ترکیب نحوی همگانی URI در ابتدا در درخواست نظر (RFC) شماره ۲۳۹۶، که در اوت ۱۹۸۸ منتشر شد، تعریف شد، و در RFC 3986، که در ژانویه ۲۰۰۵ منتشر شد، نهایی سازی گردید.

ترکیب نحوی همگانی URI شامل یک ترتیب سلسله مراتبی از پنج جزء می‌باشد^[۵]:

URI = scheme:[//authority]path[?query][#fragment]

که در آن جزء متصدی به سه زیر جزء تقسیم می‌شود:

authority = [userinfo@]host[:port]

این موضوع در یک نمودار ترکیب نحوی به صورت زیر نمایش می‌یابد:

ترکیب نحوی همگانی برای URI.

URI شامل:

برنامه (طرح) واکشی (Scheme)

یک جزء طرح غیر خالی، که بعد از آن کالن (:) می‌آید، شامل ترتیبی از نویسه‌ها است که با یک حرف شروع می‌شود، و با ترکیبی از از حروف، اعداد، جمع (+)، نقطه (.)، یا خط پیوند (-) ادامه می‌یابد. اگرچه طرح‌ها حساس به حالت نیستند، حالت رسمی، حروف کوچک است، و اسنادی که طرح‌ها را مشخص می‌کنند، باید از همین حروف کوچک استفاده کنند. مثال‌هایی از طرح‌های مردمی شامل: http, https, ftp, mailto, file, data و irc می‌باشد. طرح‌های URI، باید توسط متصدی انتساب اعداد در اینترنت (آیانا) ثبت گردند، اگرچه طرح‌های ثبت نشده در عمل استفاده می‌شوند.^[۳]

درحالی‌که بیشتر طرح‌های URI از ابتدا برای استفاده با پروتکل به‌خصوصی طراحی شده‌اند، و معمولاً هم نام مشابهی دارند، آنها از نظر معنایی با پروتکل‌ها متفاوتند. برای مثال طرح http، معمولاً برای تعامل با منابع وب، با استفاده از HTTP استفاده می‌شود، اما طرح file، پروتکلی ندارد.^[۳]

متصدی (Authority)

جزء متصدی اختیاری، که قبل از آن دو اسلش (//) می‌آید، شامل:

مشخصات کاربری (UserInfo)

یک مشخصات کاربری اختیاری که می‌تواند شامل یک نام کاربری و یک گذرواژه اختیاری باشد که قبل از آن یک کالن (:) می‌آید و بعد از آن یک نماد ات (@) می‌آید. استفاده از فرمت username:password در مشخصات کاربری به دلایل امنیتی منسوخ شده‌است. برنامه‌های کاربردی نباید هیچ داده‌ای را به عنوان متن عادی، بعد از کالن اول (:) که در زیرجزء مشخصات کاربر دیده می‌شود تحویل دهند، مگر آنکه داده‌ای که بعد از کالن می‌آید، یک رشتهٔ خالی باشد (نشان دهندهٔ نبود گذرواژه).^[۳]

میزبان (host)

یک زیرجزء میزبان(host)، شامل یا یک نام ثبت شده (شامل اما نه محدود به یک نام میزبان)، یا یک آدرس IP. آدرس‌های IPv4 باید در نشانه گذاری نقطه-عددی، و آدرس‌های IPv6 باید در براکت ([]) قرار گیرند.^[۳]

درگاه (port)

یک درگاه (port) اختیاری که قبل ار آن یک کالن می‌آید (:).^[۳]

مسیر (Path)

یک جزء مسیر، شامل یک ترتیب از بندهای مسیر که توسط اسلش (/) جداسازی می‌شوند. یک مسیر همیشه برای یک URI تعریف می‌شود، اگرچه مسیر تعریف شده می‌تواند خالی باشد (طول صفر). یک بند می‌تواند خالی باشد، و این منجر به دو اسلش پشت سر هم (//) در جزء مسیر می‌شود. یک جزء می‌تواند مشابه یا دقیقاً متناظر با یک مسیر سیستم فایل باشد، اما همیشه به معنی یک رابطه به یکی از آنها نیست. اگر یک جزء متصدی موجود باشد، آنوقت جزء مسیر باید یا خالی باشد، یا با یک اسلش (/) شروع شود. اگر جزء متصدی موجود نباشد، آنوقت مسیر نمی‌تواند توسط یک بند خالی (یعنی با دو اسلش //) شروع شود. زیرا این نویسه‌ها می‌تواند می‌تواند به صورت یک جزء متصدی تفسیر شود. بند نهایی یک مسیر «حلزونی» یا slug نامیده می‌شود.^[۳]

پرس‌وجو (Query)

یک پرس‌وجوی اختیاری که قبل از آن علامت سؤال (؟) می‌آید، و شامل یک رشته پرس‌وجو برای دادهٔ غیر سلسله مراتبی است. ترکیب نحوی آن خوش-تعریف نیست، اما رسم آن است به صورت معمول یک ترتیب از جفت‌های ویژگی-مقدار باشد که توسط یک حائل از هم جدا می‌شوند.^[۳]

پاره منبع (Fragment)

یک «پاره‌منبع» اختیاری که قبل از آن هش (#) می‌آید. این پاره‌منبع شامل یک شناسه به پاره‌منبع است که مسیری به یک منبع ثانویه تهیه می‌کند، مثال آن عنوان بخش در یک مقاله است، که توسط یک پاره‌منبع URI شناسایی می‌شود. وقتیکه منبع اولیه یک سند HTML است، باقیمانده ویژگی id برای یک عنصر به‌خصوص است، و مرورگرهای وب، این عنصر را به اسکرول می‌کنند (Scroll).^[۳]

رابطه بین URL (یوآرال)، URN (یوآران) و URI (یوآرآی)

رابطه بین URN, URL و URI

یک نام منبع یکسان (URN) یک نوع URI است که یک منبع را در یک فضای نام به‌خصوص، با نام آن شناسایی می‌کند. از URN می‌توان برای صحبت دربارهٔ یک منبع، بدون توجه به محل آن یا نحوهٔ دسترسی به آن استفاده کرد. برای مثال، در یک سیستم شماره استاندارد بین‌المللی کتاب (ISBN)، شمارهٔ ISBN 0-486-27557-4 یک ویرایش به‌خصوص از نمایشنامه شکسپیر رومئو و ژولیت را شناسایی می‌کند. URN برای آن ویرایش urn:isbn 0-486-27557-4 می‌باشد. با این حال، این عدد هیچ اطلاعاتی دربارهٔ محل یافتن یک کپی از آن کتاب را نمی‌دهد.^[۳]

یک مکان یاب منبع یکسان (URL) یک نوع URI است که هم روش عمل کردن در برابر و هم روش به دست آوردن یک نمایش از منبع را مشخص می‌کند، یعنی هم سازوکار دسترسی اولیه و هم محل شبکهٔ آن را مشخص می‌کند. برای مثال، URL با آدرس http://example.org/wiki/Main_Page به یک منبع که با /wiki/Main_Page شناسایی می‌شود ارجاع می‌کند، که نمایش آن، در قالب HTML و کدهای مرتبط، از طریق پروتکل انتقال ابرمتن (http:) از یک میزبان شبکه که نام دامنه ی آن example.org قابل دسترسی است.^[۳]

رابطهٔ بین URI و URL.

URN می‌تواند با نام یک فرد مقایسه شود، درحالی‌که URL می‌تواند با آدرس خیابان او مقایسه شود. به زبان دیگر، URN یک آیتم را شناسایی می‌کند، و URL یک روش برای یافتن آن تهیه می‌کند.^[۳]

نشریات فنی، مخصوصاً استانداردهای تولید شده توسط IETF و W3C، معمولاً یک دید عنوان شده در پیشنهاد W3C در سال ۲۰۰۱، را بازتاب می‌دهند، که در این دید ارجحیت عبارت URI نسبت به قبول هر تقسیم‌بندی رسمی به URL و URN را می‌پذیرد.^[۳]

«

URL یک مفهوم مفید اما غیررسمی است: یک URL یک نوع URI است که منبع را از طریق یک نمایش از سازوکار دسترسی اولیه آن (مثل «محل» شبکه آن)، و نه از طریق ویژگی‌های دیگری که ممکن است داشته باشد، شناسایی می‌کند.^[۶]

»

بنابراین، یک URL به سادگی یک URI است که برای اشاره به یک منبع روی یک شبکه استفاده می‌شود. با اینحال، در زمینه‌های غیر فنی، و در نرم‌افزارها برای وب جهان‌گستر، از عبارت URL بسیار استفاده می‌شود. به‌علاوه، عبارت «آدرس وب» (که هیچ تعریف رسمی ندارد) معمولاً در نشریات غیر فنی، به عنوان مترادفی برای URI، که از طرح‌های http یا https استفاده می‌کند، دیده می‌شود. این فرضیات می‌تواند منجر به سردرگمی شود، برای مثال در فضای نام XML که یک مشابهت دیداری با URIهای قابل حل دارند، این سردرگمی دیده می‌شود.^[۳]

خصیصه‌های ایجاد شده توسط WHATWG، عبارت URL را به URI ترجیح می‌دهد، و بنابراین API‌های HTML5 جدیدتر از URL به جای URI استفاده می‌کنند.^[۳]

«

روی عبارت URL استانداردسازی شده‌ایم. URI و IRI (شناسه منبع بین‌المللی) سردرگم کننده اند. در عمل یک الگوریتم مشابه برای هر دو استفاده می‌شود، بنابراین جداسازی آنها به هیچ‌کس کمکی نمی‌کند. URL در رقابت مردمی بودن نتایج جستجو برنده شده‌است.^[۷]

»

مقالات وابسته

نشانی وب

منابع

↑ شناسانه از واژه‌های مصوب فرهنگستان زبان و ادب فارسی به جای identifier در انگلیسی و در حوزه‌های مخابرات و کتابداری است.«فرهنگ واژه‌های مصوّب فرهنگستان: ۱۳۷۶ تا ۱۳۸۵، بخش لاتین». فرهنگستان زبان و ادب فارسی. ص. ۱۱۲. بایگانی‌شده از اصلی در ۱۲ مه ۲۰۱۲. دریافت‌شده در ۲۲ تیر ۱۳۹۱.«فرهنگ واژه‌های مصوب فرهنگستان ـ دفتر هشتم، بخش لاتین». فرهنگستان زبان و ادب فارسی. ص. ۴۸. بایگانی‌شده از اصلی در ۲۶ دسامبر ۲۰۱۱. دریافت‌شده در ۲۲ تیر ۱۳۹۱.
↑ RFC 3986 (2005), §3.0.
↑ ^۳٫۰۰ ^۳٫۰۱ ^۳٫۰۲ ^۳٫۰۳ ^۳٫۰۴ ^۳٫۰۵ ^۳٫۰۶ ^۳٫۰۷ ^۳٫۰۸ ^۳٫۰۹ ^۳٫۱۰ ^۳٫۱۱ ^۳٫۱۲ ^۳٫۱۳ ^۳٫۱۴ ^۳٫۱۵ "Uniform Resource Identifier". Wikipedia (به انگلیسی). 2020-01-29.
↑ «نشانی وب» [رایانه و فنّاوری اطلاعات] هم‌ارزِ «uniform resource locator, universal resource locator, URL»؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر سوم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۶۴-۷۵۳۱-۵۰-۸ (ذیل سرواژهٔ نشانی وب)
↑ RFC 3986, section 3 (2005).
↑ Joint W3C/IETF URI Planning Interest Group (2001).
↑ "URL Standard: Goals".

[1] شناسانه از واژه‌های مصوب فرهنگستان زبان و ادب فارسی به جای identifier در انگلیسی و در حوزه‌های مخابرات و کتابداری است.«فرهنگ واژه‌های مصوّب فرهنگستان: ۱۳۷۶ تا ۱۳۸۵، بخش لاتین». فرهنگستان زبان و ادب فارسی. ص. ۱۱۲. بایگانی‌شده از اصلی در ۱۲ مه ۲۰۱۲. دریافت‌شده در ۲۲ تیر ۱۳۹۱.«فرهنگ واژه‌های مصوب فرهنگستان ـ دفتر هشتم، بخش لاتین». فرهنگستان زبان و ادب فارسی. ص. ۴۸. بایگانی‌شده از اصلی در ۲۶ دسامبر ۲۰۱۱. دریافت‌شده در ۲۲ تیر ۱۳۹۱.

[FOOTNOTERFC_39862005§3.0-2] RFC 3986 (2005), §3.0.

[:0-3] ۳٫۰۰ ^۳٫۰۱ ^۳٫۰۲ ^۳٫۰۳ ^۳٫۰۴ ^۳٫۰۵ ^۳٫۰۶ ^۳٫۰۷ ^۳٫۰۸ ^۳٫۰۹ ^۳٫۱۰ ^۳٫۱۱ ^۳٫۱۲ ^۳٫۱۳ ^۳٫۱۴ ^۳٫۱۵ "Uniform Resource Identifier". Wikipedia (به انگلیسی). 2020-01-29.

[4] «نشانی وب» [رایانه و فنّاوری اطلاعات] هم‌ارزِ «uniform resource locator, universal resource locator, URL»؛ منبع: گروه واژه‌گزینی. جواد میرشکاری، ویراستار. دفتر سوم. فرهنگ واژه‌های مصوب فرهنگستان. تهران: انتشارات فرهنگستان زبان و ادب فارسی. شابک ۹۶۴-۷۵۳۱-۵۰-۸ (ذیل سرواژهٔ نشانی وب)

[FOOTNOTERFC_3986,_section_32005-5] RFC 3986, section 3 (2005).

[FOOTNOTEJoint_W3C/IETF_URI_Planning_Interest_Group2001-6] Joint W3C/IETF URI Planning Interest Group (2001).

[7] "URL Standard: Goals".

[۱]

[۲]

[۳]

[۴]

[۵]

[۶]

[۷]