A data science, ou ciências de dados, é um tema que desperta atenção. Em 2012, a Harvard Business Review declarou a profissão de data scientist, ou cientista de dados, como a mais sexy do século XXI. As pesquisas sobre o assunto aumentaram e até hoje há dúvidas sobre o que faz um cientista de dados e o que a ciências de dados tem a oferecer, como mostram o registro de pesquisas do Google de 2004 até os dias atuais (set/2020).

Buscas por data scientist e data science, no Google, no período de 01/01/2004 à 01/09/2020. As curvas demonstram uma tendência de crescimento considerável ao longo do tempo. Fonte: trends.google.com.br

A curiosidade sobre o tema é bem justificada dada o potencial que essa área oferece à diversos negócios.

Segundo o Fórum Econômico Mundial, data scientist é um dos cargos de maior demanda no mercado de trabalho da atualidade. Essa necessidade não se limita ao setor de tecnologia, mas também aos mais variados setores como saúde, finanças, entretenimento, administração e mídias.

Mas de que forma um data scientist pode contribuir para essas áreas ?

O data scientist é um profissional que fornece apoio para a tomada de decisão baseado em informação

Para isso, esse profissional deve ser capaz de organizar e extrair valor de dados. O objetivo deste profissional é tentar responder a perguntas importantes a partir dos dados que conseguir coletar.

Por exemplo, como um banco poderá avaliar se seus clientes serão bons/maus pagadores? Qual o preço pode-se definir para um determinado produto? Qual quantidade de uma determinada matéria-prima é adequada para se comprar para os próximos dois meses? Quais são os mercados mais atrativos para concentrar os esforços e os recursos para crescimento de um negócio?

Essas e outras perguntas, que podem ser estudadas por meio de dados advindos de diversas fontes, ajudam a tomar uma decisão mais assertiva. Outro exemplo é o processo de expansão empresarial que requer uma série de decisões a serem tomadas.

O estudo adequado a partir de dados traz como benefícios hipóteses mais embasadas e maior chance de sucesso nos investimentos.

Com isso, a partir das análises realizadas, sejam elas preditivas, prescritivas, descritivas ou diagnósticas, um data scientist é capaz de atuar na explicação de fenômenos, recomendação de leads, tendências, predição de eventos, construção de produtos, entre outros.

Quais as competências de um data scientist?

Para conseguir entender os dados são aplicadas ferramentas estatísticas. A estatística é um campo de conhecimento das ciências exatas que fornece métodos para analisar dados.

Um conjunto de dados que passa por tratamentos estatísticos gera indicadores e modelos que ajudam a responder diversas perguntas. Por exemplo, qual a média de vendas por mês? como o preço influencia na quantidade de vendas? Existe uma relação entre duas variáveis, preço e quantidade de vendas? Como poderia aumentar o lucro com base no conhecimento dessa relação?

O data scientist (ou Cientista de Dados) aplica tais ferramentas para validar hipóteses, utilizando dados. Dessa forma, é imprescindível que o profissional tenha conhecimento de técnicas estatísticas como levantamento, tratamento, modelagem e análise de dados.

Além de dominar estatística, é importante que o data scientist domine ferramentas computacionais. A computação é um campo de conhecimento também das ciências exatas e que estuda algoritmos. Os algoritmos são instruções que podem ser executadas por um computador. Ficou perdido? Não tem problema! 

O principal é entender que o computador é uma ferramenta capaz de executar bilhões de operações por segundo sendo mais rápido que um ser humano fazendo estes mesmos cálculos.

Utilizar ferramentas de tecnologia é extremamente importante para um cientista de dados pois atualmente a quantidade de dados é massiva e diversa, o que também é conhecido como big data.

Seria impraticável aplicar as técnicas estatísticas a esse volume massivo de dados sem um computador. Porém, não basta apenas ter um conhecimento comum de informática.

Atualmente os cientistas de dados se capacitam para utilizar ferramentas de tecnologia da informação (TI) específicas. Isso inclui aprender a programar e utilizar ferramentas computacionais para coletar, consumir, tratar e visualizar dados; além de técnicas mais avançadas como machine learning (outro termo que está em alta nas pesquisas do Google!).

Ademais, a expertise no domínio do problema é uma característica imprescindível em um data scientist. Isso significa conhecer bem o negócio e saber formular as perguntas certas, para que as respostas obtidas tenham grande valor.

Por isso, não adianta dominar estatísticas e tecnologia e não possuir entendimento adequado do problema que se pretende resolver. Sem o entendimento adequado, tanto a extração de informações relevantes, quanto modelagem e análise dos resultados ficam comprometidas, o que leva a conclusões inexatas.

Diante disso, além de conhecer métodos estatísticos e ferramentas computacionais, é fundamental ter o conhecimento de negócio, saber como interpretar as respostas de cada modelo proposto. Muito importante também é saber transmitir as respostas obtidas para os tomadores de decisão de forma adequada.

Chegar a respostas relevantes, mas não ser capaz de comunicá-las compromete o valor que é gerado por todo o trabalho executado. Assim, a extração de valor dos dados também está ligada com a boa comunicação dos resultados, que depende da habilidade de saber se comunicar com os especialistas do negócio.

O data scientist descrito também pode ser uma equipe, ou seja, as competências descritas podem ser encontradas em pessoas distintas que atuam em conjunto.

Dia a dia do cientista de dados

As tarefas envolvidas no dia a dia deste profissional incluem o estudo do negócio, coleta, estruturação e limpeza dos dados, identificação de padrões, formulação e validação de hipóteses e elaboração de modelos estatísticos aplicados. 

Essas tarefas se repetem em ciclo visando o refinamento dos resultados. Trata-se de um trabalho investigativo e iterativo e, portanto, é natural que para melhorar os resultados obtidos por uma solução proposta seja necessário ajustar alguma das etapas.

Por exemplo, para um determinado problema que se pretende resolver, pode ser que o aumento dos dados coletados melhore os resultados, enquanto que para outro problema a troca dos modelos estatísticos utilizados melhore os resultados.

Segundo a Microsoft, para implementar um processo de data science em uma equipe é uma boa prática seguir práticas e diretrizes previamente estabelecidas, para que seja possível obter todos os benefícios que podem ser extraídos da análise escolhida.

Assim, é imprescindível que os projetos tenham um ciclo de vida estabelecido, de modo que os objetivos propostos sejam tangíveis, sempre visando o sucesso da proposta. A partir do conhecimento dessas metodologias e aplicação de técnicas e análises adequadas, uma equipe de data scientists é capaz de viabilizar o retorno esperado pelo cliente.

Como organizamos nossos data scientists na IN3

Nos trabalhos conduzidos pela IN3, uma vez que nós nos comprometemos a assumir o trabalho analítico com dados, organizamos nossos data scientists em dois times que atuam de forma muito interconectada: 

  1. o time de desenvolvedores de sistemas, formado por profissionais de tecnologia da informação (TI), responsáveis por criar algoritmos, aplicativos, interfaces, arquiteturas e estruturas de dados, que sejam replicáveis e escaláveis; e 
  2. o time de conteúdo de inteligência, com foco no estudo dos dados, da pesquisa e desenvolvimento de modelagens aplicáveis aos negócios de nossos clientes, pela elaboração das análises e entregas dos resultados dos nossos produtos, além de toda a parte de comunicação e entendimento de necessidades dos clientes.

Nós já aprendemos que extrair o máximo de valor dos dados demanda uma equipe multidisciplinar e com atuação sinérgica.

Assine nossa newsletter e receba novidades