Sii Ukraine

SII POLAND

SII SWEDEN

Join us Contact us

Sii Ukraine

SII POLAND

SII SWEDEN

Back

Data Scientist – Python & Cloud Data Platforms (f/m/x)

  • Regular, 
  • Senior
  • Remote, 
  • Hybrid, 
  • Office
  • Multiple locations Show all
This offer base language is English. Translate into Ukrainian.
This translation is generic and may include errors. Show original text

Technologies & tools

We’re looking for data scientists who turn ambiguous business questions into models and analyses that actually get used. You’ll frame the problem, wrangle the data, build and validate models, and — just as importantly — explain what the numbers mean to people who don’t speak Python. Your day-to-day will revolve around the classic Python data stack: pandas, NumPy, and scikit-learn.

You’ll also work on modern enterprise data platforms — running notebooks and lakehouse workloads in Microsoft Fabric, building pipelines and operational applications in Palantir Foundry, and deploying analytics on Azure, AWS, or GCP. The science matters, but so does making it work inside a real organization’s data ecosystem.

What we offer:

AI Grant — Stop talking about AI and start building it. Our AI Grant gives you dedicated budget and resources to turn your wildest AI idea into a working project, backed by two paid weeks to focus on nothing else.

AI Center of Excellence — Work alongside specialists in agentic AI, sovereign AI, generative and discriminative AI. This isn’t a siloed team — it’s the people you’ll learn from and build with daily.

Your tools, your choice — Full access to AI-powered development tools including Claude, Cursor, and GitHub Copilot. Pick what works best for you.

Real project variety — From generative AI for legal document compliance through agentic systems in manufacturing environments to enterprise-scale AI platforms, computer vision, and autonomous driving. You won’t get bored.

Conference and speaking support — Want to attend conferences? We’ll back you. Want to speak at them? Even better — we’ll support you with dedicated preparation time and bonuses.

Your tasks

  • Translate business problems into analytical solutions: define hypotheses, choose metrics, and select the right modeling approach for the question at hand
  • Explore, clean, and prepare data using Python (pandas, NumPy), working with structured and semi-structured sources of varying quality
  • Build, validate, and tune machine learning models for classification, regression, forecasting, segmentation, and recommendation using scikit-learn, XGBoost, and statsmodels
  • Design and analyze experiments: A/B tests, statistical hypothesis testing, and causal analysis that hold up to scrutiny
  • Work hands-on with enterprise data platforms such as Microsoft Fabric (lakehouses, notebooks, semantic models) and Palantir Foundry (pipelines, ontology, operational workflows)
  • Communicate findings through clear visualizations, dashboards, and narratives tailored to technical and non-technical stakeholders alike
  • Collaborate with data engineers on data availability and quality, and with ML/AI engineers to move models from notebook to production
  • Monitor deployed models for drift and degradation, and own the retraining and improvement cycle

Requirements

  • At least 4 years in data science or applied analytics, with models and analyses that made it past the prototype stage
  • Strong Python skills across the standard data stack (pandas, NumPy, scikit-learn)
  • Solid statistical foundations: hypothesis testing, regression, experimental design, and knowing when a result is real versus noise
  • Knowledge of at least one cloud/data platform and its data science components — Azure (Microsoft Fabric, Azure Machine Learning), AWS (SageMaker), GCP (Vertex AI, BigQuery ML), Snowflake (Snowpark ML, Cortex), Databricks (MLflow, Mosaic AI), or Palantir (Foundry Code Workspaces, Foundry ML, AIP)
  • Ability to communicate analytical results clearly to business stakeholders and influence decisions with data
  • Familiarity with working autonomously while collaborating effectively with data engineers, architects, and product teams
  • Fluent English, both written and spoken
  • Fluent Polish required
  • Residing in Poland required

Nice to have

  • Production experience with Microsoft Fabric or Palantir Foundry certification (Foundry Data Engineer / Data Scientist tracks)
  • Experience with time series forecasting, NLP, recommender systems, or exposure to LLM-based workflows
  • Familiarity with MLOps practices: MLflow, experiment tracking, model versioning, and CI/CD for ML
  • Experience with Power BI or other BI tools, and distributed processing with Spark/PySpark

Job no. 260612-N20H3

Sii ensures that all hiring decisions are made solely on the basis of qualifications and competence. We are committed to equal and fair treatment of all, regardless of legally protected characteristics. At Sii, we promote a diverse and inclusive work environment, in full compliance with applicable anti-discrimination laws.

Технології

Ми шукаємо фахівців з аналізу даних, які перетворюють неоднозначні бізнес-завдання на моделі та аналітичні звіти, що дійсно знаходять практичне застосування. Ви будете формулювати проблему, обробляти дані, створювати та перевіряти моделі, а також — що не менш важливо — пояснювати значення цифр людям, які не володіють мовою Python. Ваша повсякденна робота буде зосереджена на класичному стеку даних Python: pandas, NumPy та scikit-learn.

Ви також працюватимете з сучасними корпоративними платформами даних — запускатимете ноутбуки та робочі навантаження lakehouse в Microsoft Fabric, створюватимете конвеєри та операційні додатки в Palantir Foundry, а також розгортатимете аналітику на Azure, AWS або GCP. Наука має значення, але не менш важливо зробити так, щоб вона працювала в екосистемі даних реальної організації.

Що ми пропонуємо:

Грант на AI — Припиніть говорити про AI та почніть її створювати. Наш грант на AI надає вам спеціальний бюджет та ресурси, щоб перетворити вашу найсміливішу ідею щодо AI на робочий проєкт, підкріплений двома оплачуваними тижнями, щоб ви могли зосередитися виключно на цьому.

Центр передового досвіду в галузі ШІ — працюйте пліч-о-пліч із фахівцями з агентного ШІ, суверенного ШІ, генеративного та дискримінативного ШІ. Це не ізольована команда — це люди, від яких ви будете вчитися та з якими будете працювати щодня.

Ваші інструменти, ваш вибір — повний доступ до інструментів розробки на базі штучного інтелекту, включаючи Claude, Cursor та GitHub Copilot. Обирайте те, що підходить вам найкраще.

Справжня різноманітність проєктів — від генеративного ШІ для забезпечення відповідності юридичних документів через агентні системи у виробничих середовищах до платформ ШІ корпоративного масштабу, комп'ютерного зору та автономного водіння. Вам не буде нудно.

Підтримка у участі в конференціях та виступів — Хочете відвідувати конференції? Ми вас підтримаємо. Хочете виступати на них? Ще краще — ми надамо вам спеціальний час на підготовку та бонуси.

Завдання

  • Перетворюйте бізнес-завдання на аналітичні рішення: формулюйте гіпотези, обирайте показники та підбирайте відповідний підхід до моделювання для конкретного завдання
  • Досліджуйте, очищайте та готуйте дані за допомогою Python (pandas, NumPy), працюючи зі структурованими та напівструктурованими джерелами різної якості
  • Створюйте, перевіряйте та налаштовуйте моделі машинного навчання для класифікації, регресії, прогнозування, сегментації та рекомендацій за допомогою scikit-learn, XGBoost та statsmodels
  • Розробка та аналіз експериментів: A/B-тестування, статистична перевірка гіпотез та причинно-наслідковий аналіз, що витримують ретельну перевірку
  • Практична робота з корпоративними платформами даних, такими як Microsoft Fabric (lakehouses, notebooks, семантичні моделі) та Palantir Foundry (конвеєри, онтологія, операційні робочі процеси)
  • Доносити результати за допомогою чітких візуалізацій, інформаційних панелей та описів, адаптованих як для технічних, так і для нетехнічних зацікавлених сторін
  • Співпраця з інженерами даних щодо доступності та якості даних, а також з інженерами ML/AI для перенесення моделей з ноутбука у виробництво
  • Моніторинг розгорнутих моделей на предмет відхилень та погіршення якості, а також відповідальність за цикл перенавчання та вдосконалення

Наші очікування

  • Щонайменше 4 роки досвіду роботи в галузі науки про дані або прикладної аналітики, з моделями та аналітичними дослідженнями, що пройшли стадію прототипу
  • Впевнені навички роботи з Python у стандартному стеку обробки даних (pandas, NumPy, scikit-learn)
  • Міцні статистичні основи: перевірка гіпотез, регресія, експериментальне планування та вміння розрізняти реальні результати та шум
  • Знання принаймні однієї хмарної/даних платформи та її компонентів для науки про дані — Azure (Microsoft Fabric, Azure Machine Learning), AWS (SageMaker), GCP (Vertex AI, BigQuery ML), Snowflake (Snowpark ML, Cortex), Databricks (MLflow, Mosaic AI) або Palantir (Foundry Code Workspaces, Foundry ML, AIP)
  • Здатність чітко доносити аналітичні результати до зацікавлених сторін у бізнесі та впливати на рішення за допомогою даних
  • Звичність до самостійної роботи при ефективній співпраці з інженерами даних, архітекторами та продуктовими командами
  • Вільне володіння англійською мовою, як письмовою, так і усною
  • Необхідне вільне володіння польською мовою
  • Необхідне проживання в Польщі

Буде перевагою

  • Досвід роботи з Microsoft Fabric або сертифікація Palantir Foundry (напрямки «Інженер з даних» та «Аналітик даних»)
  • Досвід у прогнозуванні часових рядів, обробці природної мови (NLP), системах рекомендацій або робота з робочими процесами на основі великих мовних моделей (LLM)
  • Знання практик MLOps: MLflow, відстеження експериментів, версіонування моделей та CI/CD для ML
  • Досвід роботи з Power BI або іншими інструментами бізнес-аналітики, а також з розподіленою обробкою даних за допомогою Spark/PySpark

Вакансія № 260612-N20H3

Sii ensures that all hiring decisions are made solely on the basis of qualifications and competence. We are committed to equal and fair treatment of all, regardless of legally protected characteristics. At Sii, we promote a diverse and inclusive work environment, in full compliance with applicable anti-discrimination laws.

Quick apply

Fill in the form in English please

Data Scientist – Python & Cloud Data Platforms (f/m/x)

Work mode*

Choose at least one option

Option was not selected

angle-down

Option was not selected

Attach CV*

Uploaded file:
  • file_icon Created with Sketch.

Acceptable files: doc, docx, pdf. (max 5MB)
Please submit your file in DOC, DOCX or PDF format
The upload size is limited to 5 MB
File is empty
File was not uploaded

At any time, you may withdraw your consent to the processing of personal data, but such withdrawal shall not affect the legal compliance of any processing of such data, which had occurred before you withdrew your consent. Detailed information on the processing of your personal data is specified in the Privacy Policy.

Sii Poland follows the Procedure for reporting law violations.

Create MySii account to follow your application's status
success

Your application has been submitted

We will contact you as soon as we review your CV

Processing...

Sorry, something went wrong and your message was not delivered

Refresh the page and try again. Contact us form, if problem occurs again

We’re sorry, but the selected file appears to be damaged and we can't process it.

Please try uploading a different copy or a new version of the file. Contact us wrong file, if problem occurs again.

Benefits for you

Apply now Recommend a friend

Änderungen im Gange

Wir aktualisieren unsere deutsche Website. Wenn Sie die Sprache wechseln, wird Ihnen die vorherige Version angezeigt.

This content is available only in English version.

Are you sure you want to leave this page?

Цей контент доступний тільки в одній мовній версії.
Ви будете перенаправлені на головну сторінку.

Ви справді бажаєте залишити цю сторінку?