Короткометражний фільм про найбільше у світі цифрове зібрання інформації. Книжки, музичні твори, телепрограми, файли, старі версії сайтів — ви точно мали причину зайти колись на archive.org. Люди, які стоять за проектом, бачать за взірець Александрійську бібліотеку. І сподіваються, що зібрані ними петабайти інформації проіснують не менше, ніж попередниця.

Читати українською:

— Коли ми почали колекцонувати всесвітню мережу, ми просто робили те ж, що роблять пошукові програми, — каже Брюстер Кале, цифровий бібліотекар. — Це, по суті, комп’ютер, який клікає на кожен лінк на кожній веб-сторінці, й тоді записує результат. А тоді заходить на ту сторінку, додає її в свою базу й клікає на кожен із тих лінків. І так це продовжується й продовжується, доки ти не дійдеш до кінця. Втім, виявилось, що кінця — немає. Мережа дійсно безкінечна. Тому ми розставили пріоритети, щоб отримувати копії деяких сторінок щодва місяці. Деякі архівуються в нас іще з 1996 року. Тоді ми зробили програму Wayback Machine, в якій можна ввести адресу, й вона покаже вам усі попередні версії, і ви можете мандрувати тим вебом, який був тоді. Ми подумали, що це буде просто забавка для людей, що захоплені якимось сайтом — чи щось таке. Але виявилось, що дуже багато хто цим користується. Wayback Machine використовують близько 500 000 людей кожного дня.

01:45

— Ну, словом, ласкаво просимо. Це “Інтернет-архів”, ми придбали цей будинок біля трьох років тому. Тут була церква Християнської науки. Спершу ми хотіли вирівняти підлогу і зробити з цього щось на кшталт бібліотеки. Але те, як виглядає бібліотека зараз, дещо неясно. Так що ми підлаштовуємось під будівлю, а будівля підлаштовується під нас.
А це — сервери, тут близько 2,5 петабайтів інтернет-архіву. Це, власне, оригінальні копії багатьох наших музичних творів та відео. Ми близькі до того, щоб досягти позначки в 10 петабайтів. У четвер ми влаштуємо вечірку, щоб відсвяткувати 10-й петабайт. Байт-щасливчик, який завершить наш десятий петабайт. А ці сервери — активні, вони працюють. Вогники сполучено з жорсткими дисками й вони показують, що хтось завантажує щось на інтернет-архів, чи скачує звідти. А червоний означає, що диск треба замінити. Що файл, певно, запущено із дзеркальної копії, яка знаходиться в іншому місці.
Коли ми намагаємось зберегти інформацію, наштовхуємось на кілька проблем. Більшість людей фокусуються на тому, що жорсткі диски не працюють, чи чомусь такому. Щиро кажучи, це вирішується просто старанністю. Ти маєш копіювати речі кожні 5 років, і якщо ти загубиш хоч біт — ти його втратиш. Така от проблема. Але є також потреба контекстуалізувати його: чи можеш ти читати старі формати. Тому ми маємо перекласти наші старі фільми, які, можливо, вийшли в форматі Mpeg2, чи якихось інших. Ми маємо повторити цей процес 5 разів, щоб зберегти їх, і щоб вони були доступні для використання. Так що це потребує постійної ретельності. Але насправді це не проблема. Проблема — в самій інституційній проблемі. Що стається з бібліотеками? Вони згоряють. Їх спалює влада. Це не політичне твердження, так просто відбувалось в історії. Бібліотека Конгресу США вже якось горіла. Тому якщо так стається з бібліотеками — давайте це продумаємо. Якщо б Александрійська бібліотека зробила копію й розмістила її десь в Індії чи Китаї, ми б мали інші роботи Арістотеля, інші п’єси Евріпіда. Це було б прекрасно! Але цього не зробили. Чому? Значною мірою через его. Ви можете сказати: ну, це дорого. Насправді, не дуже. В основному це его. Бо якщо ти візьмеш свої дорогоцінності й покладеш їх десь у чужому будинку — ну, ви не будете в захваті. Якщо будуть множинні копії — чи ви будете щасливий? Але вже починається ціла генерація людей, які живуть у світі чиленних копій. Вікіпедія, наприклад, каже: “Вперед! Зробіть Вікіпедію-2. Візьміть усе, що ми зробили, і зробіть другу Вікіпедію”. Це дійсно цікаво. Ми підключились, і зробили часткові копії себе, які розмістили в новій Александрійські бібліотеці, яка є прекрасним місцем. А також розмістили часткову копію в Амстердамі, в дата-центрі, який подарував нам частину своїх потужностей. Це ідея мати великі серйозні архіви в різних політично місцях, де є різні плюси та мінуси, викликані різними силами. І це дійсно спосіб зробити Александрійську бібліотеку-2, яка проживе принаймні стільки ж століть — а є надія, що й більше століть  — ніж перша версія бібліотеки.

05:00

— Більше серверів! Отже, це інші наші сервери, це машини фронт-енду: пошукові програми, бази даних і все таке. Ось це — машини, де зберігається інформація. Але все зроблене з одного і того ж. І це — перепрошую — стає все більш звичним. Google, Hotmail та Yahoo працюють так само. Але ми також використовуємо їх — як ви помітили, тут немає машиин — тут був офіс органіста, який колись тут працював. І ви можете відчути тепле повітря. Холодне повітря заходить, проходить через машини й виходить гарячим. Проходить через труби нашої печі, яку ми тримаємо вимкненою, і таким чином ми обігріваємо будівлю. Ми використовуємо енергію двічі. І думаємо, що це вперше, коли датацентри досягли більш ніж стовідсоткової ефективності. Тут немає кондиціонування повітря, ми використовуємо для цього мати-природу. Якщо це теплий день, як зараз — ми відкриваємо вікно. Інакше ми відкриваємо двері, й повітря циркулює всім інтернет-архівом.

06:30

— Тоді ми почали збирати ці книжки й сканувати їх. І ми не схотіли їх викидати. Ми обожнюємо книжки, і це важливо — триматись поблизу них. Відсканована книжка стає її цифровою версією, яку може отримати наступне покоління. В якомусь сенсі вона особлива.
— Вітаю. Мене звати Роберт Міллер, і я глобальний директор по книжках в Інтернет-архіві. І я стою в нашому фізичному архіві у Річмонді, штат Каліфорнія. Це дім для трьох мільйонів книжок, які зберігатимуться тут від 50 до 200 років. У нас є пристрої для щільного довгострокового зберігання речей. В них вимірюються температура й вологість. У кожній вміщується біля 40 тисяч книжок. Так що в нас тут є місце для трьох мільйонів книжок. А всього ж у світі опубліковано приблизно 100 мільйонів книжок. Ми хочемо мати одну копію кожної. Наша початкова мета — 10 мільйонів примірників. Чому стільки? Це приблизний розмір Прінстонського університету, Йєльського університету, або Бостонської громадської бібліотеки. Так що, коли я відкриваю один із засобів зберігання ось тут — бачите, там коробки, книжки, пеллети. У кожній, повторюсь, із 40 тисяч книжок. А те, що я тримаю в руці — це Британський відділ патентів позбувався своєї колекції — по суті, викидав її, і нам пощастило отримати його книжки.

08:50

— Ідея, щоб усі книжки всіх часів були доступні будь-кому, і байдуже, де ти є у світі, тому що зберігання, комп’ютери, тоді інтернет-технології зробили так, що бідний малюк у Кенії, чи бідна дитина в Канзасі може отримати доступ до великих робіт, і байдуже, де вони знаходяться чи коли їх випустили.
— Одна з речей, про які ми говоримо тут увесь час — це біт зайшов і біт вийшов. Це просто коротший спосіб сказати: “Загальний доступ до всього знання”.
— Ну, можна помістити все у “хмару”, що насправді означає передати інформацію в руки корпорацій. Це означає, що хтось може вимкнути це в будь-який момент. Yahoo Video вже зникло, Google Video вже нема, Geocities немає також. Youtube? Чи він триватиме вічно? Я не думаю. Flickr? Також не впевнений. Тому як ти будеш роздавати щось людям на постійній основі? Доступ підживлює збереження. Можна подумати: “Чому ми просто не зашифруємо все й не помістимо в якийсь бункер, щоб мати змогу подивитись на це через 70 років?” Я думаю, такий “темний архів” — найгірша ідея з можливих. Я думаю, що тримати речі у використанні, активними, яке дозволяє обмін думками, яке дозволяє людям знати про це й любити це, піклуватись про це. Так що я думаю, найкращий спосіб зберегти речі – це зробити їх доступними. Це може звучати неочевидним, але особливо в цю цифрову епоху, де так просто забути. Якщо ви заберете щось із доступу на час життя цілого покоління — це буде рівноцінним тому, що інформації не існує. Так що все, що ми робимо, має відкритий доступ. І все, що ми робимо, ми намагаємось віддати іншим. Чи можете ви запустити процес, віддавши все іншим? Це дійсний експеримент. І, схоже, він працює.
Алексіс Россі, цифрова бібліотекарка
— Ми знаємо, як видобути всю інформацію з будь-якої будь-коли написаної книжки. Ми можемо це зробити. Якщо є достатньо грошей, ми абсолютно маємо можливість зробити це просто зараз, сьогодні. Записати кожну телепрограму, яка транслюється будь-де у світі — ми знаємо, як це зробити. Ми записуємо сотню телеканалів 24 години на добу просто зараз. Питання лише в масштабі й грошах. Ми можемо робити це просто зараз. Ми знаємо, як отримувати музику із платівок. Знаємо, як отримувати відео з DVD. Ми знаємо, як робити всі ці речі. Це все можливо просто зараз.
— Дякую всім вам, що прийшли сьогодні!
— Питання в тому, чи є в нас воля це зробити. Чи ми, як країни, маємо волю профінансувати створення бібліотеки, яка дійсно дає загальний доступ до всього знання. Ми можемо зробити це просто зараз.
— Воно починає ставати великим. Але все це загалом займає лише 10 петабайтів інформації. Бібліотека Конгресу, всі слова у бібліотеці Конгресу — це десь 25 терабайтів. Так що це іще не тисяча бібліотек Конгресу, але ми починаємо підбиратись до цього.

Подивіться також “Архів” — відео про найбільшу в світі колекцію музичних платівок.