То що ж таке Big Data?
КИЇВ — 17 червня 2016 року. Комітет АПУ з питань телекомунікацій, інформаційних технологій та Інтернету провів черговий семінар у межах проекту «How does IT work?». Цього разу правники говорили про принципи роботи Big Data.
Своїми знаннями з учасниками поділився Роман Захаров, CBDO & Co-founder SoftCube LLC, з 10-річним практичним досвідом у сфері Machine Learning. Модерував дискусію Микита Полатайко, голова Комітету АПУ з питань телекомунікацій, інформаційних технологій та Інтернету, юрист, координатор ІТ-практики ЮФ Sayenko Kharenko.
Розпочали засідання з визначення, що таке, власне, Big Data. «Точного визначення Big Data немає. Це явище. Big Data — це як Ренесанс», — зазначив пан Роман.
Загалом, визначення «великі дані» можна спростити до класичного, досить популярного, американського визначення 3V: Volume (величезні обсяги інформації, з якими традиційні системи не можуть справитися), Velocity (величезна швидкість їхньої зміни, отримання в першу чергу) і Variety (різноманітність).
За словами експерта, великі дані неможливо зберігати — отримали базу даних, і наступні кілька років спокійно її використовуємо — ні, Big Data змінюються надзвичайно швидко і їх треба обробляти зараз і сьогодні.
Дані можуть бути як традиційними, реляційними базами даних, які поділені на таблички, кожна з яких, у свою чергу, складається зі стовпчиків та рядочків. Все структуровано: тільки числа, тільки назви, тільки дата і час. Однак це не стосується великих даних, адже тут лише невелика частинка є структурованими даними, а решта — ні. Ними можуть бути текст, відео, аудіо, дані з датчиків, потоки даних, інформація соціальних мереж — що завгодно. Водночас зростає кількість джерел, з яких надходить інформація (телефони, відеокамери, соціальні мережі, різноманітні системи, взаємопов’язані між собою).
«Big Data, зазвичай, не задається запитаннями, як, наприклад, в бізнес-аналітиці, а лише знаходить патерни (закономірність, зв’язок між чимось)», — зауважив пан Роман.
Під час заходу учасники також ознайомилися з принципами машинного аналізу даних, зрозуміли, в чому полягає їх відмінність від людського аналізу та як працюють системи рекомендацій.
Принагідно дякуємо KPMG Ukraine за гостинність і допомогу в проведенні зустрічі!
Слідкуйте за наступними заходами Комітету АПУ з питань телекомунікацій, інформаційних технологій та Інтернету, а також долучайтеся до нашої сторінки в мережі Фейсбук.
Презентацію можна переглянути за посиланням.