پایگاه Internet Archive و کاربردهای پژوهشی آن

سازمان Internet Archive

Internet Archve یک سازمان ناسودبر (تأسیس سال ۱۹۹۶) است که با هدف ساخت یک کتابخانهٔ دیجیتال از تارنماهای اینترنتی و دیگر محتواها -مثل نرم‌افزارها، بازی‌ها، موسیقی‌ها، فیلم‌ها، تصاویر و میلیون‌ها کتاب- در قالب دیجیتالی‌شده فعالیت می‌کند و همهٔ این‌ها را به صورت رایگان در دسترس عموم مردم جهان می‌گذارد. دفتر اصلی این سازمان در سانفرانسیسکو در کالیفرنیا قرار دارد.

مأموریت

این سازمان از مأموریت و هدف خود این‌گونه تعبیر کرده:

Our mission is to provide Universal Access to All Knowledge

مأموریت ما این است که «دسترسی جهانی به همهٔ دانش» را فراهم آوریم.

مثل روزنامه‌ها، محتواهای اینترنتی نیز زودگذر هستند و هر روز نسخهٔ دیگری از آن‌ها بروز می‌کند اما برخلاف روزنامه‌ها، کسی محتواهای اینترنتی را نگه‌داری و حفظ نمی‌کند. بالتبع محققان، مورخان و عموم مردم در آینده نمی‌توانند از محتواهای ازدست‌رفته یا تغییریافتهٔ وب استفاده کنند یا استناد به وجود چیزی در این فضا کنند.

این خلأ، دغدغه‌ای برای این سازمان شد تا بایگانی و نگه‌داری دانش را از محتواهای اینترنتی شروع کند. این سازمان از سال تأسیس (۱۹۹۶) تا اکنون بایگانی بیش از ۲۵ سال محتواهای اینترنتی را فراهم آورده که شامل چیزی حدود ۵۴۹۰۰۰۰۰۰۰۰۰ (۵۴۹بیلیون) صفحهٔ وب می‌شود.

همزمان با رشد آرشیو محتواهای وب، این سازمان شروع به بایگانی نسخهٔ دیجیتالیِ سایرِ محتواهای منتشرشده کرد که این آمار، تعداد تقریبی آن‌ها را تا کنون نشان می‌دهد:

  • ۲۹.۰۰۰.۰۰۰ کتاب و متن
  • ۶.۶۰۰.۰۰۰ فیلم (۲.۲ میلیون شامل برنامه‌ها و اخبار تلویزیونی نیز می‌شود)
  • ۱۴.۰۰۰.۰۰۰ صوت
  • ۳.۸۰۰.۰۰۰ تصویر
  • ۶۲۴.۰۰۰ نرم‌افزار

هر شخصی نیز می‌تواند فیلم، صوت، تصویر، کتاب یا… را در این پایگاه آپلود کند.
خود این پایگاه نیز با هزاران تولیدکننده همکاری می‌کند تا خروجی‌های آن‌ها را نیز به صورت ویژه بایگانی کند.

این پایگاه هر روزه میزبان چند میلیون کاربر است و در ۳۰۰ تارنمای برتر جهانی قرار دارد (+). حجم یک رونوشت از اطلاعات این پایگاه بیش از ۴۵ پتابایت است و حداقل دو رونوشت از هر محتوایی در این پایگاه نگه‌داری می‌شود، یعنی در مجموع چیزی حدود ۱۵۰.۰۰۰ ترابایت یعنی حدود ۱۵۰.۰۰۰.۰۰۰ گیگابیت. بودجهٔ این پایگاه نیز توسط کمک‌های مالی افراد و نهادهای مختلف و نیز ارائهٔ خدمات بایگانی وب و دیجیتالی‌کردن کتاب‌ها برای مجموعه‌های مختلف تأمین می‌شود.

پروژهٔ بایگانی کتاب‌ها و متون

دغدغهٔ دیگر این سازمان در مورد کتاب است، این سازمان معتقد است از آن رو که هر شخصی در هر جای جهان دسترسی به کتابخانه‌های غنی ندارد، بنابراین برای دسترسی جهانی افراد به کتاب‌ها باید نسخه‌های دیجیتالی آن‌ها را فراهم آوریم و ارائه دهیم. این سازمان از سال ۲۰۰۵ دیجیتالی‌کردن کتب را آغاز کرده و اکنون هر روز ۱۰۰۰ کتاب در بیش از ۲۸ مکان در جهان توسط این سازمان اسکن می‌شود. کتاب‌هایی که تا پیش از سال ۱۹۲۳ منتشر شده در این پایگاه قابل بارگیری است. (دیگر کتب؟)

تا کنون متون عربی این پایگاه -به صورت تقریبی- ۴۵۰.۰۰۰ عنوان است. (+)

کاربرد پژوهشی

یکی از گزینه‌هایی که برای جست‌وجو و یافتن یک کتاب در حوزهٔ تراث اسلامی و همچنین دیگر حوزه‌ها می‌توان به آن رجوع نمود، این پایگاه است.

به عنوان نمونه می‌توانید به این مجموعه‌ها نگاهی بیندازید:

نحوهٔ شکستن قفل کتاب‌های امانتی

در این تارنما به برخی از کتاب‌ها را همیشه می‌توان به صورت کامل دسترسی داشت و آن‌ها را دانلود کرد اما برخی از کتاب‌ها به صورت «امانت» (Borrow) هستند یعنی مثل کتابخانه‌های فیزیکی باید آن را برای مدت معینی امانت بگیرید و پس از آن مدت از دسترس شما خارج خواهد شد و آن گاه شخص دیگری می‌تواند آن را به امانت بگیرد.

برای شکستن قفل محدودیت زمانی این کتاب‌ها می‌توانید از نرم‌افزار AzwSoft Adobe PDF DRM Removal استفاده کنید. توضیحات بیشتر را می‌توانید در این صفحه ببینید. لکن به شدّت توصیه می‌کنیم مراقب کتاب‌هایی که باید از جهت شرعی حقوق معنوی صاحبان آن‌ها مراعات شود باشید، که مقدمهٔ این امر این است که اطلاع دقیق از قواعد شرعی حقوق فکری و معنوی داشته باشید.(1)منبع: https://tatoreh.com/free-training/آموزش-حذف-قفل-کتاب-های-سایت-آرشیو

بایگانی وب > پروژهٔ Wayback Machine

بزرگترین سازمان آرشیو‌کنندهٔ صفحات وب، Internet Archive است. رابط کاربری این شرکت که به آرشیوِ محتواهای وب پرداخته است، Wayback Machine نام گرفته است، به کمک این ماشین، رسانه‌های موجود در داخلِ صفحات وبِ قدیمی دیگر محو نخواهند شد. شما با Wayback Machine می‌توانید در زمان به عقب برگردید و محتوای تارنماها را در گذشته ببینید. تاریخ زمان عکس‌برداری از صفحات نیز از طریق این ماشین ثبت می‌شود. همچنین می‌توانید برای یک صفحهٔ خاص از طریق این ماشین، یک بایگانی ایجاد کنید، تا در آینده بتوانید به محتوای آن صفحه رجوع کنید، تغییرات آن صفحه را ردگیری کنید. این صفحه همچنین سندی خواهد بود برای اینکه در فلان تاریخ فلان محتوا در فلان آدرس اینترنتی وجود داشته است.

به عنوان مثال نگاهی به گذشتهٔ تارنمای مباحثات (mobahesat.ir) بیندازید. صرفاً برای صفحهٔ اصلی این سایت: این مربوط به مه ۲۰۱۳ است، این مربوط به ژانویهٔ ۲۰۱۶ است و این مربوط به ژانویهٔ ۲۰۲۰.

کاربردهای پژوهشی

  • برای تحقیق و بررسی: اشخاص می‌توانند گذشتهٔ وبسایت‌هایی که از بین‌رفته‌اند یا تغییر محتواهایی که در برخی سایت‌ها ایجاد شده را بررسی کنند. بدین صورت همه می‌توانند از این پایگاه برای مطالبه‌گری و جلوگیری از دروغ‌پردازی و پاک‌سازی منابع استفاده کنند. (هر چند ممکن است در موارد حساس خود این پایگاه تحت فشار سازمان‌هایی قرار بگیرد و شیطنت‌هایی کند!)
  • برای ارجاع مستحکم: برای ارجاع در مقالات و محتواهای علمی نیاز به ثبات و استحکامِ منبعی است که به آن ارجاع داده می‌شود، در صورتی که منبع مورد نظر یک صفحهٔ اینترنتی باشد، این مهم تأمین نمی‌شود و دائماً منابع اینترنتی در حال تغییر محتوایی یا حداقل تغییر آدرس هستند. این خلأ را می‌توان با استفاده از Wayback Machine حل کرد.
  • سندیّت‌داشتن: (چه قدر این سند نزد جوامع آکادمیک رسمیت دارد؟)

نحوهٔ بررسی بایگانی‌های یک صفحه

  1. به نشانی https://archive.org/web بروید؛
  2. پیوند مرده را در فیلد بزرگ بالای صفحه وارد کنید و دکمهٔ BROWSE HISTORY را فشار دهید. پس از چند لحظه به صفحه‌ای دیگر هدایت می‌شوید. اگر خود Wayback Machine آن پیوند مرده را قبلاً ذخیره کرده باشد تمام بایگانی‌های موجود به نمایش در خواهند آمد؛ ولی اگر نکرده باشد امکان بایگانی برای شما در همان لحظه فراهم می‌شود.

نحوهٔ بایگانی یک صفحه

  1. به نشانی https://archive.org/web بروید؛
  2. نشانی وبگاهی را که می‌خواهید بایگانی کنید در پایین صفحه سمت راست در قسمت Save Page Now وارد کنید و بر دکمهٔ SAVE PAGE کلیک کنید؛
  3. پس از چند لحظه نشانی بایگانی‌شده در قسمت Page saved as ظاهر می‌شود. آن را کپی کنید و در مکان مورد نظر استفاده کنید. تمام.

رجوع کنید:

پانویس‌ها

1) منبع: https://tatoreh.com/free-training/آموزش-حذف-قفل-کتاب-های-سایت-آرشیو

۲ دیدگاه دربارهٔ «پایگاه Internet Archive و کاربردهای پژوهشی آن»

  1. علی اصغر حجازی

    سلام استادنا
    بسیار آموزنده و کاربردی برای تحقیقات علمی
    احتمالا علتش بی سوادی من است ولی چون احساس می کنم خیلی ها مثل من هستند اصطلاحات را می توانید در پرانتز توضیح دهید مثل
    ناسودبر
    باز هم به دلیل بی سوادی من است ولی قسمت بایگانی وب مقداری برای من نامفهوم است
    یا حسین

    1. محمدمهدی نادری

      سلام بر سیدنا
      بنده هم تازه آشنا شده‌ام. می‌توانید اینجا دربارهٔ سازمان‌های ناسودبر بخوانید:
      https://fa.wikipedia.org/wiki/سازمان_غیرانتفاعی
      مثل اینکه شما از فایل‌های لپتاپتان، روی هاردتان بک‌آپ و پشتیبانی تهیه می‌کنید، برخی سازمان‌ها از صفحات درون اینترنت، در زمان‌های مختلف یک کپی تهیه می‌کنند تا اگر آن صفحه پاک شد، نسخه‌ای از گذشتهٔ‌ آن در دست باشد یا اگر تغییری در آن صفحه به وجود آمد معلوم باشد که در گذشته در هر زمان دارای چه محتوایی بوده.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *