В 2020 году был создан национальный стандарт в области больших данных.
Этот стандарт определяет термины и определения, связанные с большими данными, и является важным для историков, которые будут изучать историю интернета и интернета вещей.
Видео обсуждает развитие концепции десяти ви, которые не входят в стандарт, но связаны с понятием валидности, управляемости, доступности, изменчивости и семантической модели данных.
Валидность - проверка одной методики с помощью другой, например, проверка теста интеллекта с помощью других методов.
Вариабельность данных - динамичность и изменчивость источников данных.
Вакабуляр - наличие семантической модели данных, например, структурированность или отсутствие структуры.
В видео обсуждаются десять метрик больших данных, которые включают в себя семантику, неопределенность, управляемую определенность и другие.
Эти метрики помогают определить качество и полезность данных, а также их способность быть использованными для создания сервисов и информационных услуг.
Имидж-каталог - это карточный каталог, в котором хранятся карточки с информацией о книгах и авторах.
Имидж-каталог является ценным источником информации для историков и исследователей, так как он сохраняет информацию о книгах, которые больше нигде не доступны.