Курсы Apache Spark

Курсы Apache Spark

Местные учебные курсы, посвященные активному обучению Apache Spark, демонстрируют практическую практику, как Spark вписывается в экосистему Big Data и как использовать Spark для анализа данных Обучение Apache Spark доступно как «живое обучение на месте» или «дистанционное живое обучение» На месте живое обучение может проводиться локально в помещениях клиента в Казахстан или в корпоративных учебных центрах NobleProg Казахстан , Дистанционное обучение в реальном времени осуществляется с помощью интерактивного удаленного рабочего стола NobleProg Ваш местный провайдер обучения.

Machine Translated

Отзывы

★★★★★
★★★★★

Apache Spark Подкатегории

Apache Spark Содержание курса

Название курса
Длительность
Обзор
Название курса
Длительность
Обзор
21 часов
Python является масштабируемым, гибким и широко используемым языком программирования для науки о данных и машинного обучения. Spark - это двигатель обработки данных, используемый в поисках, анализе и трансформации крупных данных, в то время как Hadoop - это программная библиотека для хранения и обработки данных в большом масштабе. Этот инструктор-управляемый, живый тренинг (онлайн или на сайте) предназначен для разработчиков, которые хотят использовать и интегрировать Spark, Hadoop, и Python для обработки, анализа и трансформации больших и сложных наборов данных. К концу обучения участники смогут:
    Установите необходимую среду для начала обработки больших данных с помощью Spark, Hadoop, и Python. Понимает особенности, основные компоненты и архитектуру Спарка и Hadoop. Узнайте, как интегрировать Spark, Hadoop, и Python для обработки больших данных. Исследуйте инструменты в экосистеме Спарка (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka и Flume). Создайте совместные системы рекомендаций по фильтру, похожие на Netflix, YouTube, Amazon, Spotify и Google. Используйте Apache Mahout для масштабирования алгоритмов машинного обучения.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
21 часов
In this instructor-led, live training in Казахстан, participants will learn how to use Python and Spark together to analyze big data as they work on hands-on exercises. By the end of this training, participants will be able to:
  • Learn how to use Spark with Python to analyze Big Data.
  • Work on exercises that mimic real world cases.
  • Use different tools and techniques for big data analysis using PySpark.
21 часов
ЗАДАЧА: Этот курс представит Apache Spark Студенты узнают, как Spark вписывается в экосистему Big Data и как использовать Spark для анализа данных Курс охватывает оболочку Spark для интерактивного анализа данных, внутренних компонентов Spark, Spark API, Spark SQL, Spark streaming и машинного обучения и GraphX АУДИТОРИЯ : Разработчики / аналитики данных ,.
21 часов
Hortonworks Data Platform - это платформа поддержки Apache Hadoop с открытым исходным кодом, которая обеспечивает стабильную основу для разработки больших решений для данных в экосистеме Apache Hadoop Это обучаемое обучение в прямом эфире представляет Hortonworks и проходит участников через развертывание решения Spark + Hadoop К концу этого тренинга участники смогут: Используйте Hortonworks для надежного запуска Hadoop в больших масштабах Унифицируйте возможности Hadoop для обеспечения безопасности, управления и операций с помощью гибких аналитических рабочих процессов Spark Используйте Hortonworks для исследования, проверки, сертификации и поддержки каждого из компонентов проекта Spark Обработать различные типы данных, включая структурированные, неструктурированные, inmotion и atrest Аудитория Администраторы Hadoop Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.
14 часов
Магелан — открытый дистрибутированный двигатель для геопространственной аналитики крупных данных. Введенный выше Apache Spark, он расширяет Спарк SQL и обеспечивает относительную абстракцию для геопространственной аналитики. Этот инструктор-управляемый, живый тренинг вводит концепции и подходы к внедрению геопространственной аналитики и ходит участникам через создание предсказуемого анализа приложения с использованием Магелана на Spark. К концу обучения участники смогут:
    Эффективно спрашивать, расчесывать и присоединяться к геопространственным наборам данных по масштабу Введение геопространственных данных в бизнес-интелигенцию и прогнозирующие аналитические приложения Используйте пространственный контекст для расширения возможностей мобильных устройств, датчиков, журналов и носителей.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
7 часов
Alluxio является виртуальной распределенной системой хранения с открытым исходным кодом, которая объединяет разнообразные системы хранения и позволяет приложениям взаимодействовать с данными по скорости памяти. Он используется такими компаниями, как Intel, Baidu и Alibaba. В этом инструктор-управляемом, живым обучением участники узнают, как использовать Alluxio для моста различных вычислительных рамок с системами хранения и эффективно управлять множественными петабайтными данными, как они проходят через создание приложения с Alluxio. К концу обучения участники смогут:
    Разработать приложение с Alluxio Подключение систем и приложений больших данных при сохранении одного имени Эффективно выводит ценность из больших данных в любом формате хранения Улучшение производительности рабочей нагрузки Распределение и управление Alluxio самостоятельным или кластерным
аудитории
    Ученый данных Разработчик Системный администратор
Формат курса
    Частная лекция, частичная дискуссия, упражнения и тяжелая практика
7 часов
Spark SQL - это модуль Apache Spark для работы со структурированными и неструктурированными данными Spark SQL предоставляет информацию о структуре данных, а также о выполненном вычислении Эта информация может использоваться для выполнения оптимизации Два распространенных применения Spark SQL: для выполнения SQL-запросов для чтения данных из существующей установки Hive В этом обученном, живом обучении (на месте или удаленном) участники узнают, как анализировать различные типы наборов данных, используя Spark SQL К концу этого тренинга участники смогут: Установите и настройте Spark SQL Выполнение анализа данных с использованием Spark SQL Набор данных запроса в разных форматах Визуализируйте данные и результаты запроса Аудитория Аналитики данных Ученые данных Инженеры по данным Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
21 часов
Обработка потоков относится к обработке в реальном времени «данных в движении», то есть выполнению вычислений по данным по мере их получения Такие данные считываются как непрерывные потоки из источников данных, таких как события датчиков, активность пользователя веб-сайта, финансовые сделки, проверки кредитных карт, потоки кликов и т Д Структуры обработки потоков способны считывать большие объемы поступающих данных и предоставлять ценную информацию почти мгновенно В этом обученном, живом обучении (на месте или удаленном) участники узнают, как настраивать и интегрировать различные платформы Stream Processing с существующими большими системами хранения данных и сопутствующими программными приложениями и микросервисами К концу этого тренинга участники смогут: Установка и настройка различных инфраструктур Stream Processing, таких как Spark Streaming и Kafka Streaming Понять и выбрать наиболее подходящую структуру для работы Процесс данных непрерывно, одновременно и в режиме записи в режиме записи Интеграция решений Stream Processing с существующими базами данных, хранилищами данных, данными озерами и т Д Интеграция наиболее подходящей библиотеки обработки потоков с корпоративными приложениями и микросервисами Аудитория Разработчики Архитекторов программного обеспечения Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметки Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
21 часов
Большая аналитика данных включает в себя процесс изучения большого количества разнообразных наборов данных для выявления корреляций, скрытых шаблонов и других полезных сведений В отрасли здравоохранения имеется огромное количество сложных гетерогенных медицинских и клинических данных Применение большой аналитики данных по медицинским данным представляет огромный потенциал для получения информации о повышении качества медицинской помощи Однако огромность этих наборов данных создает большие проблемы при анализе и практическом применении в клинической среде В этом обученном, живом обучении (удаленном) участники узнают, как выполнять большую аналитику данных в области здоровья, когда они проходят через ряд упражнений для упражнений handson livelab К концу этого тренинга участники смогут: Установите и настройте инструменты большой аналитики данных, такие как Hadoop MapReduce и Spark Понять характеристики медицинских данных Применять большие методы данных для обработки медицинских данных Изучение больших систем данных и алгоритмов в контексте приложений для здоровья Аудитория Разработчики Ученые данных Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson Заметка Чтобы запросить индивидуальную подготовку для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться ,.
21 часов
Apache Spark's learning curve is slowly increasing at the begining, it needs a lot of effort to get the first return. This course aims to jump through the first tough part. After taking this course the participants will understand the basics of Apache Spark , they will clearly differentiate RDD from DataFrame, they will learn Python and Scala API, they will understand executors and tasks, etc.  Also following the best practices, this course strongly focuses on cloud deployment, Databricks and AWS. The students will also understand the differences between AWS EMR and AWS Glue, one of the lastest Spark service of AWS.     AUDIENCE: Data Engineer, DevOps, Data Scientist
21 часов
Scala - это сжатая версия Java для крупномасштабного функционального и объектно-ориентированного программирования. Apache Spark Streaming - это расширенный компонент API Spark для обработки больших наборов данных в виде потоков в реальном времени. Вместе Spark Streaming и Scala обеспечивают потоковую передачу больших данных. Это интерактивное обучение под руководством инструктора (локальное или дистанционное) предназначено для разработчиков программного обеспечения, которые хотят передавать большие объемы данных с помощью Spark Streaming и Scala . К концу этого тренинга участники смогут:
  • Создавайте приложения Spark на языке программирования Scala .
  • Используйте Spark Streaming для обработки непрерывных потоков данных.
  • Обрабатывайте потоки данных в реальном времени с помощью Spark Streaming.
Формат курса
  • Интерактивная лекция и обсуждение.
  • Много упражнений и практики.
  • Практическая реализация в среде живых лабораторий.
Параметры настройки курса
  • Чтобы заказать индивидуальное обучение для этого курса, пожалуйста, свяжитесь с нами, чтобы договориться.
14 часов
SMACK представляет собой совокупность программного обеспечения платформы данных, а именно Apache Spark, Apache Mesos, Apache Akka, Apache Cassandra, и Apache Kafka. С помощью SMACK stack пользователи могут создавать и масштабировать платформы обработки данных. Эта инструкторская, живая подготовка (онлайн или онлайн) направлена на ученых данных, которые хотят использовать SMACK стак для создания платформ обработки данных для больших решений для данных. К концу обучения участники смогут:
    Введение архитектуры трубопроводов данных для обработки больших данных. Развитие кластерной инфраструктуры с Apache Mesos и Docker. Анализ данных с помощью Spark и Scala. Управление неструктурированными данными с помощью Apache Cassandra.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
21 часов
Apache Spark представляет собой аналитический двигатель, предназначенный для распределения данных по кластеру с целью их параллельной обработки. Он содержит модули для потока, SQL, машинного обучения и графической обработки. Этот инструктор-управляемый, живый тренинг (онлайн или онлайн) предназначен для инженеров, которые хотят внедрить Apache Spark систему для обработки очень больших объемов данных. К концу обучения участники смогут:
    Настройка и установка Apache Spark. Разумеется, разница между Apache Spark и Hadoop MapReduce и когда использовать какую. Быстро читайте в и анализируйте очень большие наборы данных. Интегрировать Apache Spark с другими инструментами машинного обучения.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
21 часов
Apache Spark является распределенным процессором для анализа очень больших наборов данных. Он может обрабатывать данные в комплектах и в режиме реального времени, а также осуществлять машинное обучение, рекламные запросы и графическую обработку. .NET для Apache Spark - это бесплатная, открытая и транс-платформенная база данных, которая поддерживает приложения, написанные в C# или F#. Этот инструктор-управляемый, живый тренинг (онлайн или на сайте) предназначен для разработчиков, которые хотят провести большой анализ данных с использованием Apache Spark в своих приложениях.NET. К концу обучения участники смогут:
    Настройка и установка Apache Spark. Понимайте, как.NET внедряет Spark APIs, чтобы они могли быть доступны из приложения.NET. Разработка приложений для обработки данных с помощью C# или F#, способных обрабатывать наборы данных, размер которых измеряется в терабитах и педабитах. Разработка функций машинного обучения для приложения.NET с использованием Apache Spark возможностей. Проводить исследовательский анализ с использованием SQL запросов на большие наборы данных.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
35 часов
Apache Hadoop - это популярная система обработки данных для обработки больших наборов данных на многих компьютерах. Этот инструктор-управляемый, живый обучение (онлайн или онлайн) направлено на системных администраторов, которые хотят узнать, как установить, расположить и управлять Hadoop кластерами в рамках своей организации. К концу обучения участники смогут:
    Настройка и настройка Apache Hadoop. Понимайте четыре основных компонента Hadoop экосистемы: HDFS, MapReduce, YARN и Hadoop Common. Используйте Distributed File System (HDFS) для масштабирования кластера до сотен или тысяч узлов. •   Настройка HDFS для работы в качестве двигателя хранения для развертывания Spark. Настройка Spark для доступа к альтернативным решениям хранения, таким как системы баз данных Amazon S3 и No SQL, такие как Redis, Elasticsearch, Couchbase, Aerospike и т.д. Выполняйте административные задачи, такие как предоставление, управление, мониторинг и обеспечение кластера Apache Hadoop.
Формат курса
    Интерактивная лекция и дискуссия. Много упражнений и практики. Реализация в живой лабораторной среде.
Курс персонализации опций
    Для получения персонализированного обучения на этот курс, пожалуйста, свяжитесь с нами для организации.
14 часов
This instructor-led, live training in Казахстан (online or onsite) is aimed at data scientists and developers who wish to use Spark NLP, built on top of Apache Spark, to develop, implement, and scale natural language text processing models and pipelines. By the end of this training, participants will be able to:
  • Set up the necessary development environment to start building NLP pipelines with Spark NLP.
  • Understand the features, architecture, and benefits of using Spark NLP.
  • Use the pre-trained models available in Spark NLP to implement text processing.
  • Learn how to build, train, and scale Spark NLP models for production-grade projects.
  • Apply classification, inference, and sentiment analysis on real-world use cases (clinical data, customer behavior insights, etc.).
35 часов
MLlib - библиотека обучения по изучению аппаратов Spark (ML) Его цель - сделать практическое машинное обучение масштабируемым и легким Он состоит из общих алгоритмов обучения и утилит, включая классификацию, регрессию, кластеризацию, совместную фильтрацию, уменьшение размерности, а также примитивы оптимизации нижнего уровня и API-интерфейсы верхнего уровня Он делится на два пакета: sparkmllib содержит оригинальный API, созданный на основе RDD sparkml обеспечивает API более высокого уровня, построенный поверх DataFrames для построения ML-конвейеров Аудитория Этот курс направлен на инженеров и разработчиков, стремящихся использовать встроенную библиотеку машин для Apache Spark ,.
21 часов
This course is aimed at developers and data scientists who wish to understand and implement AI within their applications. Special focus is given to Data Analysis, Distributed AI and NLP.
28 часов
Большое количество проблем реального мира можно описать в терминах графиков Например, веб-график, график социальной сети, график сети поездов и график языка Эти графики имеют тенденцию быть чрезвычайно большими; для их обработки требуется специализированный набор инструментов и процессов, которые эти инструменты и процессы могут называться Graph Computing (также известными как Graph Analytics) В этом обученном, живом обучении участники узнают о предлагаемых технологиях и подходах к реализации для обработки графических данных Цель состоит в том, чтобы идентифицировать объекты реального мира, их характеристики и отношения, а затем моделировать эти отношения и обрабатывать их как данные с использованием подхода графового вычисления Мы начинаем с широкого обзора и узкого подхода к конкретным инструментам, когда мы проводим серию тематических исследований, упражнений для рук и живого развертывания К концу этого тренинга участники смогут: Понять, как сохраняются и перемещаются данные графика Выберите наилучшую структуру для заданной задачи (из графических баз данных в рамки пакетной обработки) Внедрите Hadoop, Spark, GraphX ​​и Pregel для выполнения графических вычислений на многих машинах параллельно Просмотр больших проблем с данными в реальном времени с точки зрения графиков, процессов и обходов Аудитория Разработчики Формат курса Часть лекций, обсуждение частей, упражнения и тяжелая практика handson ,.

Last Updated:

выходные Apache Spark курсы, курсы Apache Spark выходного дня, вечерние Apache Spark курсы, Apache Spark технические учебные курсы, Apache Spark буткемп, Apache Spark буткэмп, Apache Spark курсы с инструктором, Apache Spark тренинг с инструктором, выходной Apache Spark тренинг, тренинг Apache Spark выходного дня, вечерние Apache Spark курсы, Apache Spark коачинг, Apache Spark тренерство, Apache Spark тренинг, Apache Spark инструктор, Apache Spark тренер, Apache Spark коач, Apache Spark курсы, Apache Spark занятия, Apache Spark локальные, Apache Spark частные занятия, Apache Spark частные курсы, Apache Spark индивидуальный тренинг, Apache Spark индивидуальные занятия

Скидки

В настоящее время акции не проводятся

Информационная рассылка

Мы уважаем конфиденциальность Ваших персональных данных. Мы обязуемся не передавать Ваши данные третьим лицам. Вы всегда можете изменить свои настройки конфиденциальности или полностью отказаться от подписки.

Наши клиенты

is growing fast!

We are looking for a good mixture of IT and soft skills in Kazakhstan!

As a NobleProg Trainer you will be responsible for:

  • delivering training and consultancy Worldwide
  • preparing training materials
  • creating new courses outlines
  • delivering consultancy
  • quality management

At the moment we are focusing on the following areas:

  • Statistic, Forecasting, Big Data Analysis, Data Mining, Evolution Alogrithm, Natural Language Processing, Machine Learning (recommender system, neural networks .etc...)
  • SOA, BPM, BPMN
  • Hibernate/Spring, Scala, Spark, jBPM, Drools
  • R, Python
  • Mobile Development (iOS, Android)
  • LAMP, Drupal, Mediawiki, Symfony, MEAN, jQuery
  • You need to have patience and ability to explain to non-technical people

To apply, please create your trainer-profile by going to the link below:

Apply now!

Этот сайт в других странах / регионах