Лекция по Компьютерным технологиям в научных исследованиях и образовании (05.10.2023)

YOUTUBE · 18.11.2025 19:21

Ключевые темы и таймкоды

Введение в понятие больших данных

11:43
  • Видео начинается с приветствия и объяснения, что сегодня будет обсуждаться тема больших данных.
  • Большие данные - это данные, которые постоянно пополняются и не могут быть обработаны на персональном компьютере.

Определение и примеры больших данных

14:23
  • Большие данные определяются как совокупность данных, которые постоянно пополняются и превышают определенный рубеж, после которого их можно добывать.
  • Примеры больших данных включают информацию о платежах, истории жизни общества и истории техники.

Объем данных и их рост

21:03
  • Объем данных увеличивается в 40 раз за последние 60 лет, и каждый год появляются новые возможности и потребности.
  • Большие данные требуют новых технологий и порождают новые потребности в обработке и изучении данных.

Инфографика о росте объема данных

21:59
  • Инфографика показывает, как объем данных и памяти изменялся за последние 60 лет.
  • В 2021 году объем данных увеличивается в 100 раз по сравнению с 2018 годом.

Введение

24:44
  • В видео обсуждается понятие "большие данные" и их источники.
  • Большие данные - это данные, которые собираются и анализируются для получения информации о поведении пользователей.

Источники больших данных

25:10
  • Источники больших данных включают в себя данные из социальных сетей, данные из поисковых запросов, данные из логов и данные из файлов журналов.
  • Лог-файлы - это файлы, в которых записываются события в хронологическом порядке, и они являются основным источником больших данных.

Ограничение нашего вокабуляра

26:54
  • В русском языке существует ограничение на использование определенных слов и выражений, что связано с историей и культурой.
  • Это ограничение не распространяется на грамматику и орфографию, но может влиять на использование лексики.

Большие данные и журналирование

31:42
  • Большие данные берутся из функции журналирования, которая записывает все действия, происходящие в операционной системе, на сервере и в базе данных.
  • Журналирование позволяет отслеживать ошибки, а также накапливать данные для персонализации поиска и создания новых возможностей.

Введение в большие данные

32:57
  • Видео начинается с обсуждения больших данных и их важности для историков.
  • Большие данные - это данные, которые невозможно обработать вручную, и они становятся все более важными для историков.

Примеры больших данных

33:20
  • В качестве примера больших данных, историк приводит данные о том, что в 2019 году в России было 140 миллионов пользователей интернета.
  • Также упоминаются данные о том, что 90% населения России имеют доступ к интернету.

Лок файлы и их значение

35:44
  • Лок файлы - это файлы, которые хранят информацию о доступе к сайту или странице.
  • С помощью лок файлов можно определить, откуда и когда был осуществлен доступ к сайту или странице.

Стандарты больших данных

41:10
  • В 2020 году был создан национальный стандарт в области больших данных.
  • Этот стандарт определяет термины и определения, связанные с большими данными, и является важным для историков, которые будут изучать историю интернета и интернета вещей.

Большие данные и их свойства

45:59
  • Видео обсуждает историю больших данных и их свойства, такие как объем, скорость, разнообразие и достоверность.
  • В 2011 году был предложен подход с пятью измерениями для описания больших данных: объем, скорость, разнообразие, ценность и достоверность.

Десять ви и их значение

1:02:08
  • Видео обсуждает развитие концепции десяти ви, которые не входят в стандарт, но связаны с понятием валидности, управляемости, доступности, изменчивости и семантической модели данных.
  • Валидность - проверка одной методики с помощью другой, например, проверка теста интеллекта с помощью других методов.
  • Вариабельность данных - динамичность и изменчивость источников данных.
  • Вакабуляр - наличие семантической модели данных, например, структурированность или отсутствие структуры.

Введение в большие данные

1:09:00
  • Видео начинается с обсуждения больших данных и их важности для развития технологий и науки.
  • Большие данные - это структурированные и неструктурированные данные, которые могут быть использованы для анализа и принятия решений.

Десять метрик больших данных

1:10:31
  • В видео обсуждаются десять метрик больших данных, которые включают в себя семантику, неопределенность, управляемую определенность и другие.
  • Эти метрики помогают определить качество и полезность данных, а также их способность быть использованными для создания сервисов и информационных услуг.

Гуманитарные обобщения

1:15:09
  • В видео рассматриваются гуманитарные обобщения, связанные с большими данными, включая изменение концепции чтения и размытие пристального чтения.
  • Автор обсуждает, как большие данные влияют на поиск информации и как они могут быть использованы для создания новых сервисов и услуг.

Отдаленное чтение

1:16:00
  • Отдаленное чтение - это чтение, при котором читатель не вникает в текст, а просто просматривает его, не анализируя и не вдумываясь.
  • Отдаленное чтение может быть аналитическим или поверхностным, когда читатель просматривает заголовки и лиды к новостям, не читая их полностью.

Влияние на когнитивные способности

1:20:05
  • Отдаленное чтение может негативно влиять на когнитивные способности, особенно у детей и подростков.
  • Важно регулировать время, проводимое за отдаленным чтением, и использовать его для анализа и изучения информации.

Имидж-каталог

1:25:47
  • Имидж-каталог - это карточный каталог, в котором хранятся карточки с информацией о книгах и авторах.
  • Имидж-каталог является ценным источником информации для историков и исследователей, так как он сохраняет информацию о книгах, которые больше нигде не доступны.

Концепция чтения и новые поводы углубления

1:28:52
  • Видео обсуждает, как меняется концепция чтения и появляются новые поводы углубления в чтение.
  • Тик-токи и короткие видео могут использоваться для непрерывного обучения и изучения новых тем.

Имидж-каталог и его значение

1:30:50
  • Имидж-каталог - это база данных, которая содержит информацию о различных объектах, включая исторические документы и архивы.
  • Имидж-каталог может помочь привлечь интерес к историческому наследию и антропологии Сибири.

Гипермедиатека и ее значение

1:32:26
  • Гипермедиатека - это новая форма хранения информации, которая связывает различные ресурсы и позволяет проводить статистический анализ данных.
  • Каждый может участвовать в создании гипермедиатеки, редактируя страницы в википедии или создавая свои собственные проекты.

Поиск информации в гипермедиатеке

1:38:06
  • Поиск информации в гипермедиатеке может быть осуществлен с помощью различных сервисов, таких как википедия и вики-проекты.
  • Участники видео демонстрируют, как можно использовать эти сервисы для поиска информации по антропологии Сибири.