Коротко­ме­тражний фільм про найбільше у світі цифрове зібрання інфор­мації. Книжки, музичні твори, телепро­грами, файли, старі версії сайтів — ви точно мали причину зайти колись на archive.org. Люди, які стоять за проектом, бачать за взірець Алексан­дрійську бібліотеку. І споді­ва­ються, що зібрані ними петабайти інфор­мації проіснують не менше, ніж попере­дниця.

Читати україн­ською:

— Коли ми почали колекцо­нувати всесвітню мережу, ми просто робили те ж, що роблять пошукові програми, — каже Брюстер Кале, цифровий бібліо­текар. — Це, по суті, комп’ютер, який клікає на кожен лінк на кожній веб-сторінці, й тоді записує результат. А тоді заходить на ту сторінку, додає її в свою базу й клікає на кожен із тих лінків. І так це продов­жу­ється й продов­жу­ється, доки ти не дійдеш до кінця. Втім, виявилось, що кінця — немає. Мережа дійсно безкі­нечна. Тому ми розставили пріоритети, щоб отримувати копії деяких сторінок щодва місяці. Деякі архіву­ються в нас іще з 1996 року. Тоді ми зробили програму Wayback Machine, в якій можна ввести адресу, й вона покаже вам усі попередні версії, і ви можете мандрувати тим вебом, який був тоді. Ми подумали, що це буде просто забавка для людей, що захоплені якимось сайтом — чи щось таке. Але виявилось, що дуже багато хто цим користу­ється. Wayback Machine викори­сто­вують близько 500 000 людей кожного дня.

01:45

— Ну, словом, ласкаво просимо. Це «Інтернет-архів», ми придбали цей будинок біля трьох років тому. Тут була церква Христи­ян­ської науки. Спершу ми хотіли вирівняти підлогу і зробити з цього щось на кшталт бібліотеки. Але те, як виглядає бібліотека зараз, дещо неясно. Так що ми підла­што­ву­ємось під будівлю, а будівля підла­што­ву­ється під нас.
А це — сервери, тут близько 2,5 петабайтів інтернет-архіву. Це, власне, оригі­нальні копії багатьох наших музичних творів та відео. Ми близькі до того, щоб досягти позначки в 10 петабайтів. У четвер ми влаштуємо вечірку, щоб відсвя­ткувати 10-й петабайт. Байт-щасливчик, який завершить наш десятий петабайт. А ці сервери — активні, вони працюють. Вогники сполучено з жорсткими дисками й вони показують, що хтось заван­тажує щось на інтернет-архів, чи скачує звідти. А червоний означає, що диск треба замінити. Що файл, певно, запущено із дзеркальної копії, яка знахо­диться в іншому місці.
Коли ми намага­ємось зберегти інфор­мацію, наштов­ху­ємось на кілька проблем. Більшість людей фокусу­ються на тому, що жорсткі диски не працюють, чи чомусь такому. Щиро кажучи, це вирішу­ється просто старан­ністю. Ти маєш копіювати речі кожні 5 років, і якщо ти загубиш хоч біт — ти його втратиш. Така от проблема. Але є також потреба контекс­ту­а­лі­зувати його: чи можеш ти читати старі формати. Тому ми маємо перекласти наші старі фільми, які, можливо, вийшли в форматі Mpeg2, чи якихось інших. Ми маємо повторити цей процес 5 разів, щоб зберегти їх, і щоб вони були доступні для викори­стання. Так що це потребує постійної ретель­ності. Але насправді це не проблема. Проблема — в самій інсти­ту­ційній проблемі. Що стається з бібліо­теками? Вони згоряють. Їх спалює влада. Це не політичне твердження, так просто відбу­валось в історії. Бібліотека Конгресу США вже якось горіла. Тому якщо так стається з бібліо­теками — давайте це проду­маємо. Якщо б Алексан­дрійська бібліотека зробила копію й розмі­стила її десь в Індії чи Китаї, ми б мали інші роботи Арістотеля, інші п’єси Евріпіда. Це було б прекрасно! Але цього не зробили. Чому? Значною мірою через его. Ви можете сказати: ну, це дорого. Насправді, не дуже. В основному це его. Бо якщо ти візьмеш свої дорого­цін­ності й покладеш їх десь у чужому будинку — ну, ви не будете в захваті. Якщо будуть множинні копії — чи ви будете щасливий? Але вже почина­ється ціла генерація людей, які живуть у світі чиленних копій. Вікіпедія, наприклад, каже: «Вперед! Зробіть Вікіпедію-2. Візьміть усе, що ми зробили, і зробіть другу Вікіпедію». Це дійсно цікаво. Ми підклю­чились, і зробили часткові копії себе, які розмі­стили в новій Алексан­дрійські бібліотеці, яка є прекрасним місцем. А також розмі­стили часткову копію в Амстердамі, в дата-центрі, який подарував нам частину своїх потужностей. Це ідея мати великі серйозні архіви в різних політично місцях, де є різні плюси та мінуси, викликані різними силами. І це дійсно спосіб зробити Алексан­дрійську бібліотеку-2, яка проживе принаймні стільки ж століть — а є надія, що й більше століть — ніж перша версія бібліотеки.

05:00

— Більше серверів! Отже, це інші наші сервери, це машини фронт-енду: пошукові програми, бази даних і все таке. Ось це — машини, де збері­га­ється інфор­мація. Але все зроблене з одного і того ж. І це — перепрошую — стає все більш звичним. Google, Hotmail та Yahoo працюють так само. Але ми також викори­сто­вуємо їх — як ви помітили, тут немає машиин — тут був офіс органіста, який колись тут працював. І ви можете відчути тепле повітря. Холодне повітря заходить, проходить через машини й виходить гарячим. Проходить через труби нашої печі, яку ми тримаємо вимкненою, і таким чином ми обігрі­ваємо будівлю. Ми викори­сто­вуємо енергію двічі. І думаємо, що це вперше, коли датацентри досягли більш ніж стовід­со­ткової ефектив­ності. Тут немає конди­ціо­ну­вання повітря, ми викори­сто­вуємо для цього мати-природу. Якщо це теплий день, як зараз — ми відкри­ваємо вікно. Інакше ми відкри­ваємо двері, й повітря циркулює всім інтернет-архівом.

06:30

— Тоді ми почали збирати ці книжки й сканувати їх. І ми не схотіли їх викидати. Ми обожнюємо книжки, і це важливо — триматись поблизу них. Відска­нована книжка стає її цифровою версією, яку може отримати наступне покоління. В якомусь сенсі вона особлива.
— Вітаю. Мене звати Роберт Міллер, і я глобальний директор по книжках в Інтернет-архіві. І я стою в нашому фізичному архіві у Річмонді, штат Каліфорнія. Це дім для трьох мільйонів книжок, які збері­га­ти­муться тут від 50 до 200 років. У нас є пристрої для щільного довго­стро­кового збері­гання речей. В них вимірю­ються темпе­ратура й вологість. У кожній вміщу­ється біля 40 тисяч книжок. Так що в нас тут є місце для трьох мільйонів книжок. А всього ж у світі опублі­ковано приблизно 100 мільйонів книжок. Ми хочемо мати одну копію кожної. Наша початкова мета — 10 мільйонів примір­ників. Чому стільки? Це приблизний розмір Прінстон­ського універ­ситету, Йєльського універ­ситету, або Бостон­ської громад­ської бібліотеки. Так що, коли я відкриваю один із засобів збері­гання ось тут — бачите, там коробки, книжки, пеллети. У кожній, повторюсь, із 40 тисяч книжок. А те, що я тримаю в руці — це Британ­ський відділ патентів позбу­вався своєї колекції — по суті, викидав її, і нам пощастило отримати його книжки.

08:50

— Ідея, щоб усі книжки всіх часів були доступні будь-кому, і байдуже, де ти є у світі, тому що збері­гання, комп’ютери, тоді інтернет-техно­логії зробили так, що бідний малюк у Кенії, чи бідна дитина в Канзасі може отримати доступ до великих робіт, і байдуже, де вони знахо­дяться чи коли їх випустили.
— Одна з речей, про які ми говоримо тут увесь час — це біт зайшов і біт вийшов. Це просто коротший спосіб сказати: «Загальний доступ до всього знання».
— Ну, можна помістити все у «хмару», що насправді означає передати інфор­мацію в руки корпо­рацій. Це означає, що хтось може вимкнути це в будь-який момент. Yahoo Video вже зникло, Google Video вже нема, Geocities немає також. Youtube? Чи він триватиме вічно? Я не думаю. Flickr? Також не впевнений. Тому як ти будеш роздавати щось людям на постійній основі? Доступ підживлює збере­ження. Можна подумати: «Чому ми просто не зашифруємо все й не помістимо в якийсь бункер, щоб мати змогу подивитись на це через 70 років?» Я думаю, такий «темний архів» — найгірша ідея з можливих. Я думаю, що тримати речі у викори­станні, активними, яке дозволяє обмін думками, яке дозволяє людям знати про це й любити це, піклу­ватись про це. Так що я думаю, найкращий спосіб зберегти речі – це зробити їх досту­пними. Це може звучати неоче­видним, але особливо в цю цифрову епоху, де так просто забути. Якщо ви заберете щось із доступу на час життя цілого покоління — це буде рівно­цінним тому, що інфор­мації не існує. Так що все, що ми робимо, має відкритий доступ. І все, що ми робимо, ми намага­ємось віддати іншим. Чи можете ви запустити процес, віддавши все іншим? Це дійсний експе­римент. І, схоже, він працює.
Алексіс Россі, цифрова бібліо­те­карка
— Ми знаємо, як видобути всю інфор­мацію з будь-якої будь-коли написаної книжки. Ми можемо це зробити. Якщо є достатньо грошей, ми абсолютно маємо можли­вість зробити це просто зараз, сьогодні. Записати кожну телепро­граму, яка транс­лю­ється будь-де у світі — ми знаємо, як це зробити. Ми записуємо сотню телека­налів 24 години на добу просто зараз. Питання лише в масштабі й грошах. Ми можемо робити це просто зараз. Ми знаємо, як отримувати музику із платівок. Знаємо, як отримувати відео з DVD. Ми знаємо, як робити всі ці речі. Це все можливо просто зараз.
— Дякую всім вам, що прийшли сьогодні!
— Питання в тому, чи є в нас воля це зробити. Чи ми, як країни, маємо волю профі­нан­сувати створення бібліотеки, яка дійсно дає загальний доступ до всього знання. Ми можемо зробити це просто зараз.
— Воно починає ставати великим. Але все це загалом займає лише 10 петабайтів інфор­мації. Бібліотека Конгресу, всі слова у бібліотеці Конгресу — це десь 25 терабайтів. Так що це іще не тисяча бібліотек Конгресу, але ми починаємо підби­ратись до цього.

Подивіться також «Архів» — відео про найбільшу в світі колекцію музичних платівок.