View in Telegram
В поиска крипто-датасетов по блокчейну, биткоину, Ethereum и тд. Вот наглядный пример поиска в Google Dataset Search, в Perplexity, в AI помощнике Quora и в Dateno при поиске по слову "Ethereum". ИИ помощники выдают неплохие результаты, но очень ограниченные основными первоисточниками. Google Dataset Search выдаёт разное, делая акцент на Kaggle и свои продукты, но сразу после первой страницы идут разного рода коммерческие и недоступные источники. В Dateno сейчас всего 34 результата по слову "Ethereum" и часть ссылок уже не работает, удалены в первоисточнике. Это один из примеров запросов и тем где требуется больше усилий чем просто собрать метаданные откуда попало. Я на днях анализировал почему датасетов по крипте в Dateno мало и следующие выводы: 1. Открытые датасеты по крипте чаще всего большие и чаще встречаются в каталогах данных для машинного обучения. Их будет сильно больше после индексирования Kaggle, Hugging Face и др. 2. Многие крипто данные доступны только как открытые и коммерческие API, надо индексировать их описание. 3. Криптодатасеты есть в маркетплейсах данных Amazon, Google BigQuery, Azure и тд. Там не так много датасетов всего, но объёмы датасетов и востребованность велики. Собирать данные по криптодатасетам не похоже на многие другие, но мы вскоре начнём их загружать в Dateno. #opendata #crypto #cryptodata
Telegram Center
Telegram Center
Channel