Профессии финтеха: Data Scientist
Новые профессии появляются буквально каждый день, важно понимать, на что делать ставку, какие знания получать, и как их трансформировать. Мы отследили основные тренды, собрали информацию и подкрепили ее комментариями Льва, дата-сайентиста Globerce Capital.
Читается за
Кто такой дата-сайентист
Специалист, который с помощью навыков анализа данных и построения моделей машинного обучения, создает различные инструменты под задачи бизнеса.
Дата-сайентисты работают везде, где есть большие объемы информации, а потому можно найти себе место в любой сфере - от розничной торговли до астронавтики. Но чаще всего они работают в крупном бизнесе и стартапах.
Дата-сайентист отвечает за создание моделей верификации, анализ покупательской способности и поведения в магазине и так далее.
Для отдела маркетинга дата-сайентист анализирует данные карт лояльности и выстраивает систему, каким клиентам, какую рекламу показывать. Логистам помогает оптимизировать маршрут по данным GPS. Продажникам формирует данные о спросе на товары с учетом сезонности. И даже для HR-отдела создает базу сотрудников, которые могут уволиться в ближайшее время – благодаря анализу активности в течение рабочего дня. В случае с банками, дата-сайентисты создают модель банковского скоринга, которая определяет, под какой процент можно предоставить вам ипотеку.
В общем, все, что связано с большим массивом данных, которые необходимо проанализировать, сделать выводы и выстроить необходимую систему, отправляется в руки дата-сайентиста.
Лев: “На работе я возглавляю нашу дата-команду, которая состоит из дата-сайентистов и дата-инженеров. Также я создаю модели машинного обучения. Наша команда работала над онлайн-оценкой недвижимости и автомобилей, рекомендательной системой, разрабатывала скоринговые модели. Мы работаем с табличными данными, фотографиями и текстом”.
Что делает дата-сайентист
Когда вы листаете ленту Instagram, то можете наткнуться на “рекомендации” от социальной сети. Эти подборки основаны на анализе контента, который вы лайкали и просматривали. Это и есть работа дата-сайентиста – выстроить алгоритм так, чтобы вам попадался релевантный контент.
Чаще всего в работе используются уже существующие алгоритмы, и от специалиста важно понимать, где, когда и какие из них применять.
Базовые задачи строятся примерно по такой системе: осознание бизнес-задачи – сбор данных, необходимых для решения задачи – анализ и структурирование данных – построение модели машинного обучения – проверка правильности работы модели.
Лев: “Дата-сайентист, как и любой специалист с приставкой Data, решает проблемы и вопросы бизнеса с помощью данных, а также автоматизирует человеческий труд. Представьте, что у нас есть много картинок с собаками и кошками. К вам приходит руководитель и говорит: “Нам нужно онлайн определять, кошка на картинке или собака”. Дата-сайентист берет эти картинки, переводит их в цифры и создает на их основе модель. Модель, в свою очередь, обучается, как отличить кошку от собаки, и выдает ответ. На месте кошек и собак может быть, что угодно. К примеру, можно определить, выплатит кредит человек или выйдет на просрочку. Если есть данные, то можно сделать все, что угодно”.
Если описать коротко, то дата-сайентист строит и тестирует математические модели поведения данных. Это необходимо для поиска закономерностей и прогнозирования будущих значений.
Сколько зарабатывает дата-сайентист
Спрос на дата-сайентистов только растет. По данным Всемирного экономического форума, работа в этой сфере занимает первое место в рамках спроса на рынке. И будет находиться там минимум до 2025 года. За последние три года количество вакансий на дата-сайентиста выросло на 433%.
Зарплата у специалиста растет соответственно его опыту работы и совершенствованию своих навыков.
Карьерный рост выглядит так:
- Junior – необходимы базовые знания машинного обучения и статистики, понимание алгоритмов.
- Middle – минимум 2-3 успешных проекта за плечами, уверенные знания в проведении экспериментов и тестировании.
- Senior – минимум 5 успешных проектов, полная самостоятельность и способность обучать команду.
- Team Lead – должен уметь формировать задачи, контролировать их исполнение и четко понимать бизнес-задачи проекта.
- CDO – должен уметь формировать концепцию поэтапного изменения бизнес-модели компании, уметь разрабатывать стратегии трансформации и масштабирования.
Лев: “Дата-сайентисты гонятся за интересными задачами и возможностью экспериментировать. В первую очередь у дата-сайентиста должен быть дух исследователя. А где интересные сложные задачи, там и платят хорошо.
Еще можно уйти в ресерч. Data Science относительно молодая сфера, много подходов еще неизведанно, много gpu (graphics processing unit или графический процессор, прим. ред.) еще не загружено”.
Нишевых специалистов не хватает, компании пытаются найти, схантить или обучить своих сотрудников. Поэтому в этой сфере наблюдается рост зарплат. Зарабатывать можно от 350.000 тенге до 1.500.000 тенге и выше, в зависимости от вашей должности и финансовых возможностей компании.
Что надо знать дата-сайентисту
Специалисту необходимо не только знать технические дисциплины, но и уметь управлять командой и иметь хорошие социальные скиллы.
С технической стороны необходимо знать языки программирования (Python, SQL), математическую статистику и уметь создавать машинное обучение. И, конечно, уметь работать с инструментами Apache Spark и Hadoop Mapreduce.
Со стороны социальных скиллов и менеджмента необходимо понимать специфику бизнеса, коммуницировать с коллегами и уметь презентовать результаты своей работы.
Чем нравится работа
Лев: “Мой путь в эту профессию был тернист. По образованию я экономист, на втором курсе начал заниматься научной деятельностью. Но после практики на втором курсе, я понял, что мне не нравится эта сфера, и я хочу заниматься чем-то другим. Я начал искать, что сейчас актуально в мире, и нашел Data Science. Когда я писал статьи, именно работа с данными мне была наиболее интересна. Я начал читать научпоп про нейронные сети и понял, что хочу изучать именно эту область. Признаться честно, получилось у меня не с первого раза. Во время обучения были попытки уйти в бэкенд и мобильную разработку, потому что я встретил много преград на своем пути. Даже когда я уже работал, была попытка стать креативным продюсером. Но каждый раз я возвращался в Data Science.
После двух лет самообучения, я устроился аналитиком на преддипломную практику в СКБ “Контур”. Я занимался чем-то средним между бизнес- и дата-аналитикой, был в команде внутреннего стартапа, который хотел вывести продукт компании на Европейский рынок. Затем я устроился в Сбербанк, где занимался прогнозированием экономических показателей по всему Сбербанку. Со временем мне это наскучило, и я начал искать новую работу. Я получил 4 оффера от разных компаний и команд. Но в августе 2021, меня пригласили в Казахстан в Globerce Capital. Мне понравились задачи, перспективы и условия, которые предложили. Поэтому я решил переехать в Алматы. И ни разу не пожалел”.
Рекомендуется к прочтению
What to read next
15 сентября у Guardian вышел текст. В нем редакция проводит ...
В Казахстане утвердили правила онлайн-торгов для продажи ...
18 октября в очередной раз пройдет ежегодная профессиональная ...