Дніпро,  Харків,  Херсон,  Київ,  Львів,  Одеса,  Remote.UA
Дистанційна робота
Дніпро,  Харків,  Херсон,  Київ,  Львів,  Одеса,  Remote.UA
Дистанційна робота

About the vacancy

The client is an international company that provides an online genealogy service that helps its clients understand their past and family history.

We are looking for a Data Engineer who will join a team working on the maintenance of the data workflow and ingestion of scanned newspaper image data. This involves handling a lot of data throughput in a reliable and consistent way.

The specialist will help the existing team to manage the file systems, databases, and data ingestion into Solr, as well as managing internal, web-based tools that the client’s Quality Control team uses to validate images before they are published.

There is also an element of DevOps and Systems Administration - the team works with a significant number of physical and virtual servers, handling deployment pipelines, etc.

In the coming months, the client will be investigating an option to include Machine Learning techniques as part of a process to improve the quality of their OCR. There is a likelihood that they will apply some ML techniques over the course of this project, but this is likely only to constitute a part of the role.

There are multiple teams consisting of 5-7 people. The teams include DataArt engineers and stakeholders from the client side working in a mature Agile environment.

We hire people not for a project but for the company. If the project (or your work on it) is over you go to another project or to a paid “Idle”.

Responsibilities

  • Managing file systems; managing databases; managing data ingest into Solr and managing Solr at scale
  • Handling large amounts of XML
  • Management of internal, web-based tools
  • Potential to use ML techniques as a part of the process of improving the quality of their OCR, possibly after a few months

Must have

  • Experience with SQL (MySQL) databases and handling large amounts of data
  • Comfortable working from the terminal in Linux/Unix (Ubuntu)
  • Good knowledge of at least one programming language (Ruby, Python etc.)
  • A hands-on approach to getting stuff done
  • A curiosity to learn and widen your skillset
  • Rails (for internal web-based tools)
  • Experience with ZFS, XML
  • Tensorflow (not extensively so far – used for ML work)
  • AWS/Azure (used from time to time)
  • Experience with Apache Solr

Would be a plus

  • Focus on quality, with testing experience and a willingness to pair collaboratively
  • Background in DevOps/Systems Administration
  • Experience with Docker, Git, Kubernetes
  • Experience with XML processing
  • Working knowledge of, or an interest in image data processing

Learn more about our policy of equal opportunities in employment

Робота в DataArt це

Перш за все - люди

Стосунки з клієнтами та між колегами засновані на взаємоповазі, не дивлячись на наші відмінності

  • Довготривале партнерство
  • Ми поважаємо індивідуальність та свободу самовираження
  • Гнучкий графік, комфортні офіси та можливість працювати з дому
  • Ринкова компенсація і турбота про здоров'я
  • Висока якість внутрішніх адміністративних сервісів

Професіоналізм

Можливість розкрити свій потенціал в екосистемі DataArt

  • Команда професіоналів та цікаві завдання
  • Безперервний обмін знаннями у спільнотах за інтересами
  • Програма вивчення англійської мови
  • Внутрішня система професійного навчання

Гнучкість

Можливість експерименувати та здобувати новий досвід і знання, готовність до змін

  • Безстрокові трудові взаємини з DataArt, а не з проектом
  • Плоска структура організації
  • Мінімум правил
  • Правила та процедури можуть змінюватися, цінності ми дбайливо зберігаємо
  • Можливість працювати з будь-якого нашого центру розробки, допомога при релокації

Довіра

Можливість розраховувати один на одного та готовність довіряти людям - основа взаємин у Dataart

  • Роль лідерів в DataArt полягає у створенні умов за яких люди самостійно примають рішення
  • Зрозумілі та однакові для всіх правила і політики
  • Ми ретельно підходимо до оцінки рівня кваліфікації
  • Ми не заохочуємо суперництво між колегами в колективі і не маємо регулярного оцінювання персоналу

Не знайшли необхідну інформацію?

Все одно відправте нам резюме - ми спробуємо що-небудь придумати

Відправити резюме

Не знайшли необхідну інформацію?

Все одно відправте нам резюме - ми спробуємо що-небудь придумати

Відправити резюме

Схожі вакансії