Arquivo da categoria: Machine Learning

Ciência de dados e Big Data: meus dois centavos.


Na maioria das vezes é mais fácil começar a descrever algo dizendo o que este “algo” não é. E, definitivamente, ciência de dados – ou usando o nome popularizado em inglês, Data Science –  não é uma corrida no Kaggle para ver quem aplica o maior número de algoritmos de aprendizado de máquina (ou machine learning, como bastante difundido  por terras tupiniquins também) em menos tempo, obtendo a maior acurácia possível. Continuar lendo

[Github] Análise de sentimentos – Rotten Tomatoes


Publiquei recentemente um repositório no Github contendo um código Python cuja função é fazer uma análise de sentimentos utilizando algoritmos de classificação tendo como base um dataset com reviews de filmes do site Rotten Tomatoes. Este dataset é disponibilizado em dois arquivos:  um contendo reviews positivos, e outro contendo reviews negativos.

Como os dados estão limpos e balanceados, torna-se mais fácil lidar com eles e aplicar os típicos algoritmos de classificação.

Segue o link do repositório: https://github.com/lasleandro/sentiment_analysis