Web in Learning!

Веб-технологии и веб-сервисы в обучении. Обучение «в облаке»

Тим Бернерс-Ли о следующем поколении Сети

20 лет назад Тим Бернерс-Ли (Tim Berners-Lee) изобрёл Всемирную паутину (World Wide Web). Для своего следующего проекта он строит сеть открытых связанных данных, которая сможет сделать для цифр то же, что Web сделал для слов, изображений и видео: открыть доступ к нашим данным и пересмотреть то, как мы их совместно используем.



Перевод выступления

Время летит. Уже почти 20 лет прошло с тех пор как, желая пересмотреть то, как мы пользуемся информацией, то, как мы вместе работаем, я изобрёл Всемирную паутину. Теперь, 20 лет спустя, на TED я хочу попросить вас помочь в ещё одном пересмотре.

Итак, возвратимся в 1989 год, когда я написал записку, в которой предложил глобальную гипертекстовую систему. Никто толком не обратил на нее внимания. Но спустя 18 месяцев — так возникают инновации, 18 месяцев спустя мой босс сказал, что я могу развивать идею дальше как своего рода игрушечный проект — обкатать наш новый компьютер. И он дал мне время на написание кода. Я в общих чертах набросал своё видение HTML, гипертекстового протокола — HTTP, и идею об URL — всяких названиях, которые начинаются с HTTP. Я написал и выложил код.

Почему я это сделал? В основном из-за неудовлетворённости. Я был разочарован — я разрабатывал программное обеспечение в этой большой, захватывающей лаборатории, куда приезжали люди со всех уголков мира, они привозили с собой всевозможные компьютеры со всевозможными форматами данных и всевозможными системами документирования. Так что если во всём этом многообразии я хотел понять, как что-то построить, из кусочков того и кусочков другого, все приходилось подключать к новой машине, разбираться, как запускать новую программу, я сталкивался с тем, что информация, которая мне нужна, сохранена в каком-то новом формате, не было никакой совместимости. Все это было очень досадно. Особенно досаждало то, что не использовался весь этот потенциал.

Фактически, на всех этих дисках были документы. Если представить что они все — часть большой виртуальной системы документации, существующей, скажем, в интернете, жизнь была бы намного легче. И, когда у вас появилась идея наподобие этой, вы как бы срастаетесь с нею, и даже если никто не читает ваших записок — на самом деле он прочёл, уже после его смерти была найдена копия, он написал в углу карандашом: «неясно, но захватывающе».

(Смех)

Но в общем было трудно — действительно трудно объяснить, что из себя тогда представляла сеть. А теперь очень трудно объяснить, почему это было трудно объяснить тогда. Но потом, когда появился TED, сети не существовало, у таких понятий как щелкнуть были другие значения. Я могу показать кусок гипертекста, страницу со ссылками, и если щёлкнуть по ссылке — появится другая гипертекстовая страница. Не впечатляет. Вы знаете, это уже было, гипертекстовые документы на компакт-дисках. Что было сложно, так это представить, Представить, что любая ссылка могла вести к практически любому документу, который только можно представить. Перейти к этому пониманию было очень трудно. Но у некоторых получалось. Хотя это было сложно объяснить, существовало движение снизу, которое делало всё это крайне интересным. Самым захватывающим была не технология, не то, как она использовалась, а сообщество и атмосфера, в которой все эти люди оказывались и отправляли друг другу емейлы. Вот как это выглядело тогда.

И знаете что? Забавно, но сейчас происходит то же самое. Тогда я попросил всех выложить свои документы — я сказал «не могли бы вы выложить свои документы в сеть?» И вы это сделали. Спасибо. Это был прорыв, не правда ли? Я имею в виду, это было довольно интересно мы увидели, что происходившее с сетью, абсолютно нас поражало. Вначале мы всё представляли существенно более примитивным, чем получалось, когда мы собирали сайт, с которым начинали работу. Теперь, я хочу, чтобы вы поместили свои данные в сеть. Оказывается, что до сих пор остаётся огромный неиспользованный потенциал. До сих пор остаётся огромное чувство досады, сохраняющееся потому, что данные в сети не представлены в виде данных.

Что имеется в виду под «данными»? Чем отличаются документы от данных? Документы — это то, что мы читаем, так? Мы их читаем, переходим по ссылкам, и это всё. С данными с помощью компьютера можно делать всё, что угодно. Кто видел выступление Ганса Розлинга? Одно из выдающихся, да, многие его видели, — одно из выдающихся выступлений на TED. Ганс в своей презентации показал в различных цветах для разных стран уровень доходов по одной оси и уровень детской смертности, и он снял всё это анимированным во времени. Так вот, он взял эти данные и сделал презентацию, разрушившую многие мифы, касавшиеся экономик развивающихся стран.

Он сделал слайд примерно так: Изначально у него были все данные, Хорошо, данные серые, квадратные и скучные мы так себе их и представляем, не правда ли? Потому что сами по себе данные мы использовать не можем, но на самом деле они во многом определяют то, что происходит в нашей жизни, потому что кто-то каким-то образом обрабатывает эти данные. В данном случае Ганс собрал данные, которые нашёл на сайте ООН и других. Он собрал их все вместе, объединил в нечто более интересное, нежели исходные фрагменты, и с помощью этой программы, разработанной, вроде, его сыном, сделал замечательную презентацию. Таким образом Ганс показал, что «смотрите, действительно важно иметь много данных». И я был рад увидеть, что вчера на вечеринке он повторял с большой убеждённостью, что «очень важно обладать данными».

Я хочу, чтобы мы подумали о том, что произойдёт, если будут объединены не два фрагмента данных, не шесть, как сделал Ганс, но я хочу представить себе мир, в котором все разместили свои данные в сети, и практически всё, что только можно представить, находится в сети. Я называю это связанными данными. Связанные данные — это технология, она крайне проста. Если вы хотите поместить что-либо в сеть — есть три правила: во-первых, все эти HTTP имена, всё, что начинается с http, мы используем сейчас не просто для доступа к документам, а для доступа к тому, о чём говорят эти документы. Мы используем их для доступа к людям и местам, мы используем их для доступа к товарам и событиям. Концептуальные вещи самого разного рода теперь имеют названия, начинающиеся с HTTP.

Второе правило: если я возьму одно из HTTP имён, найду его в сети, получу с него данные, используя протокол HTTP, я получаю в ответ некие данные в стандартном формате которые могут быть полезны тем, кто захочет узнать что-либо о чем-нибудь, об этом мероприятии — кто присутствует на мероприятии, что оно из себя представляет, про этого человека, где он родился и тому подобное. Так что второе правило — я получаю важную информацию.

Третье правило заключается в том, что когда я получаю эту информацию, это не просто чей-то рост, вес и дата рождения. Полученная информация обладает взаимосвязями. Данные — это взаимосвязи. Интересно, данные — это взаимосвязи. Этот человек родился в Берлине, Берлин находится в Германии. И когда существуют взаимосвязи, когда они выражаются, тогда другой объект, с которым связан исходный, получает имя, начинающееся с HTTP. Итак, я могу взять и посмотреть этот объект. К примеру, я ищу человека — я могу найти город, где он родился, я могу найти регион, к которому он относится, его население и так далее. То есть я могу всё это просматривать.

Вот собственно и всё. Это и есть связанные данные. Несколько лет назад я написал статью под названием «Связанные данные», и вскоре после этого всё завертелось. Идея связанных данных заключается в том, что мы получаем множество коробочек, как у Ганса, из которых появляется множество побегов. Это не просто масса других растений. Это не просто корень, поддерживающий растение, Но для каждого из этих растений, будь то презентация или анализ, кто-то пытается обнаружить закономерности в данных, они просматривают все данные и пытаются связать их вместе. По настоящему важное свойство данных заключается в том, что чем больше фрагментов вы связываете, тем важнее становится результат.

Итак, связанные данные. Этот шаблон действий распространился дальше, и вскоре, Крис Спитцер из Свободного берлинского университета, один из первых людей, создавших интересные вещи, обратил внимание, что Википедия, знаете, Википедия — это онлайн энциклопедия содержащая в себе множество интересных документов. В этих документах есть небольшие информационные блоки, в которых представлены данные. Так вот, он написал программу, извлекавшую данные из Википедии и помещавшую их в шарик связанных данных, размещённый в сети, который он назвал dbpedia. На этом слайде dbpedia представлена синим шариком в центре. И если вы попробуете найти Берлин, вы обнаружите другие шарики данных, где также упоминается Берлин, и они связаны вместе. Таким образом, когда вы вытаскиваете из dbpedia данные о Берлине, вы вытаскиваете вместе с ними и всё эти вещи. И то, что всё это начинает расти — особенно захватывает. Это снова то самое движение снизу, так?

Давайте немного подумаем о данных. В действительности данные существуют в самых разных формах. Подумайте о разнообразии сети, по-настоящему важно, что сеть позволяет размещать в себе любые типы данных. Так происходит с данными. Я мог бы говорить о всевозможных типах данных. Мы могли бы говорить о правительственных данных, корпоративных данных — они очень важны, есть научные данные, личные данные, метеорологические данные, данные о мероприятиях, о выступлениях, также есть новости и много чего другого. Я упомяну лишь небольшую их часть, чтобы вы смогли представить себе их разнообразие, могли увидеть, какой там потенциал .

Давайте начнём с правительственных данных. Барак Обама в своей речи сказал, что данные американского правительства будут общедоступны в интернете в удобных форматах. И я надеюсь, что эти данные будут размещены в формате связанных данных. Это важно. Почему? Не только из-за прозрачности, да, прозрачность в действиях правительства важна, но сами данные – это данные из всех министерств. Подумайте, какое количество данных относится к американской жизни. Они по-настоящему полезны, у них есть ценность. Я могу воспользоваться ими в своей компании, если бы я был школьником, я мог бы воспользоваться ими, делая домашнюю работу. Мы говорим о том, что делаем мир лучше, делая эти данные доступными.

На самом деле, если вы знаете о каких-либо данных в министерстве, то зачастую вы обнаруживаете, что эти люди поддаются сильному искушению оставить данные себе, Ганс называет это обниманием базы данных. Ты обнимаешь свою базу данных, ты не хочешь отпускать её, пока не сделаешь для неё красивый сайт. Я бы скорее предложил, что да, делайте красивый сайт, кто я такой, чтобы запрещать вам это делать? Делайте красивый сайт, но сначала дайте нам необработанные данные, они нам нужны. Нам нужны необработанные данные. Хорошо, теперь мы должны потребовать необработанные данные. Я попрошу вас потренироваться в этом, хорошо? Скажите «необработанные».

Зал: Необработанные

Тим: можете сказать «данные»?

Зал: Данные

Тим: Можете сказать «сейчас»?

Зал: Сейчас!

Тим: Идёт. Необработанные данные сейчас!

Зал: Необработанные данные сейчас!

Попрактикуйтесь. Это важно, потому что вы себе даже не представляете, сколько оправданий люди выдумывают, чтобы продолжать держаться за свои данные и не отдавать их вам, даже несмотря на то что вы как налогоплательщик за них заплатили. И так не только в Америке. Так во всём мире. И, конечно, не только в правительствах, но и в бизнесах.

Ещё несколько мыслей о данных. Здесь на TED, мы хорошо осознаём огромные вызовы, стоящие в настоящее время перед человечеством — лечение раковых заболеваний, понимание механизмов болезни Альцгеймера, понимание экономики, чтобы сделать её чуть более стабильной, понимание того, как устроен мир. Люди, которые найдут ответы на эти вопросы, учёные, имеют наполовину сформировавшиеся идеи, пытаются сообщать их через сеть. Но значительная часть знаний человеческой расы в настоящий момент хранится в базах данных, зачастую на локальных компьютерах, они недоступны для совместного использования.

На самом деле, я каснусь только одной области — если вы посмотрите, например, как разрабатываются лекарства для лечения болезни Альцгеймера, то там сейчас появляется масса связанных данных, потому что учёные из данной области понимают, что это прекрасное решение проблемы, их данные по геному находились в одной базе в одном здании, а данные по протеинам — в другой. Теперь они соединяют эти данные — связанные данные, и могут задать такой вопрос, который вы вряд ли зададите, я не задам. Какие протеины участвуют в сигнальной трансдукции, а также имеют отношение к пирамидальным нейронам? Итак, запомните эту фразу и поищите в Google. Само собой, страницы с ответом на этот вопрос в сети не существует, потому что никто не задавал этот вопрос раньше. Вы получите 223,000 результатов, но ни одного, которым вы сможете воспользоваться. Если адресовать тот же вопрос связанным данным, то получится 32 результата, каждый из которых — протеин с искомыми свойствами, и на каждый можно посмотреть. Для ученого умение формулировать эти вопросы, вопросы, связывающие различные дисциплины, это полнейшай трансформация. Это очень, очень важно. В настоящее время учёные загнаны в тупик, мощь данных, собранных другими учёными, недоступна, и чтобы справиться с этими проблемами, мы должны разблокировать данные.

Если продолжу, вы подумаете, что все данные производятся большими институтами, и это не имеет никакого отношения к вам. Но это не так. На самом деле, данные составляют нашу жизнь. Вы авторизуетесь на сайте своей любимой социальной сети, вы говорите «Это мой друг». И вот, связь. Данные. Вы говорите «эта фотография такого-то человека». И вот, данные. Данные, данные, данные. Каждый раз, когда вы что-либо делаете в социальной сети, сайт собирает данные, использует и обрабатывает, чтобы сделать пребывание других людей на сайте более интересным. Но когда вы заходите на другой сайт со связанными данными, скажем, сайт о путешествиях, и говорите «я хочу послать эту фотографию всем членам такой-то группы», вы не можете этого сделать. В журнале Economist была статья на эту тему, многие люди писали об этом в своих блогах, огромное разочарование. Пробить брешь в закрытых хранилищах данных можно, создав совместимость между социальными сетями. Нам нужно это сделать с помощью связанных данных.

Я скажу об ещё одном типе данных, возможно, наиболее впечатляющем. Прежде чем приехать сюда, я нашёл это место на OpenStreetMap. Это карта, но также и Вики. Приблизьте, и этот квадрат окажется театром, в котором мы сейчас находимся, The Terrace Theater. Но это имя не было обозначено на карте. Так что у меня была возможность перейти в режим редактирования, выбрать театр, добавить внизу его название и сохранить. И теперь, если вы зайдёте на OpenStreetMap.org, и найдёте это место, вы обнаружите, что у The Terrace Theater теперь есть название. Я сделал это. Я! Я проделал это с картой. Я только что это сделал! Я отметил имя на карте. И вы знаете что? Суть этой карты заключается в том, что каждый вносит свою лепту, а в итоге создаётся невероятный ресурс, потому что все остальные поступают так же. В этом и заключается смысл связанных данных. Смысл заключается в том, что каждый что-то делает, и всё это связывается. Так работают связанные данные. Вы вносите свой вклад, все остальные вносят свой. Возможно, у вас не найдется большого количества данных, чтобы разместить их там, но вы сможете их запросить. Мы практиковали это.

Итак, связанные данные — это огромная тема. Я рассказал вам только малую часть. Данные присутствуют в каждом аспекте нашей жизни, каждом аспекте работы и отдыха. И дело не только в числе источников данных, но в связывании этих данных. Когда вы связываете данные, вы получаете могущество, которое недоступно лишь сети или документам. Вы получаете по-настоящему огромную силу. Итак, мы находимся на этапе, когда мы должны сделать это — люди, считающие, что это отличная идея. И все эти люди, а я думаю на TED много людей, которые что-то делают, даже несмотря на отсутствие возможности вернуть инвестиции быстро, потому что затея окупится только когда все остальные поступят так же, они сделают это потому, что они относятся к той категории людей, которые просто делают то, что принесёт результат, если все остальные сделают то же. Итак, это — связанные данные. Я хочу, чтобы вы это сделали. Я хочу, чтобы вы этого потребовали. И я думаю, эта идея достойна распространения.

Спасибо.

(Аплодисменты)

Translated into Russian by Elmira Gazizova
Reviewed by Artyom Morozov

Источник: TED