Які типові випадки використання Spark?
Які варіанти використання Apache Spark?
- Фінансові послуги. Spark використовується в банківській справі, щоб прогнозувати відтік клієнтів і рекомендувати нові фінансові продукти. …
- Охорона здоров'я. Spark використовується для створення комплексного догляду за пацієнтами, надаючи дані медичним працівникам на передовій лінії для кожної взаємодії з пацієнтом. …
- Виробництво. …
- Роздрібна торгівля.
Spark Streaming підтримує обробку потокових даних у реальному часі, наприклад файли журналу робочого веб-сервера (наприклад, Apache Flume і HDFS/S3), соціальні мережі, такі як Twitter, і різні черги обміну повідомленнями, такі як Kafka.
Як загальна найкраща практика Spark корисний коли стає важко обробляти дані на одній машині. Наприклад, користувачі Python люблять використовувати pandas, але коли DataFrames починають наближатися до 1-10 мільйонів рядків, обробка на одній машині стає важкою.
Нижче наведено дев’ять елементів, які зазвичай включають у варіанти використання:
- Номер випадку використання та заявка. Цей розділ призначає номер вашому випадку використання для ведення записів. …
- Ім'я та опис випадку використання. …
- Актор. …
- Зацікавлена сторона. …
- Основний актор. …
- Передумови. …
- Тригери. …
- Основний потік.
Netflix використовує Apache Spark Streaming для обробки даних у реальному часі. Наприклад, події відтворення, такі як початок, зупинка, пауза, буферизація та зміни якості, транслюються та обробляються в режимі реального часу для моніторингу та покращення взаємодії з користувачем.