Pizza de Dados artwork

Episódio 012: Big Data

Pizza de Dados

Portuguese - September 22, 2018 03:00 - 55 minutes - 51 MB - ★★★★ - 5 ratings
Technology Homepage Download Apple Podcasts Google Podcasts Overcast Castro Pocket Casts RSS feed


Agradecimento especial aos nossos Parceiros

Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos em https://databootcamp.com.br/calendar.


Os padrinhos desse episódio

Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.


Tópicos abordados neste episódio

Quem são e o que fazem nossos convidados
Big Data além da hype
Diferenças entre Big Data e Análise de Dados tradicional
Ferramentas para trabalhar com big data

Escute agora


Pessoas nesse episódio

Leticia Portella
Twitter

Jessica Temporal
Twitter

Gustavo Coelho
Twitter

Diogo Munaro
Twitter

Renan Oliveira
Twitter

Apoie o pizza:

Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.


Apoiar o Pizza


Links

Coisas que mencionamos durante esse episódio:

#PerguntaProPizza

#PerguntaProPizza
Uma thread no twitter da Leticia Silva com vários cursos
Boas práticas para reproducibilidade de pesquisa (em ingles)
Google Datasets: tipo google scholar mas para datasets
O DJ Patil, em conjunto com mais dois autores, lançaram um livro (em inglês) sobre ética e data science link pro tweet e o link pro livro na loja da Amazon Brasileira
Big Data
Aprendizado de Máquina ou Machine Learning
BI (business intelligence)
Pentaho
Técnicas de ETL (Extract, Transform and Load)
Data Lake e Data warehouse
Open Source
Hadoop
Kafka
Hive
Parquet
Spark
Map Reduce
Pig
HDFS
Barramento
Data Locality
Pandas
DevOps
JVM ou Máquina Virtual Java
Série Temporal
Cross Validation ou Validação Cruzada
Reinforcement Learning ou Aprendizado por Reforço
K-fold
Overfitting ou Sobreajuste
Python
Scala
Serveless
Cluster
React
CRUD
Serenata de Amor
Kaggle
GitHub
T-Test ou teste de T de Student
Teste multivariado e Teste A/B
Brasil.io

Pérolas?! Temos muitas

Eu trabalho com big data desde antes de ser legal
big data é tudo que é grande o suficiente pra quebrar o excel
já vi o hadoop voar, mas nunca vi o kafka cair
eu já tive tantos nomes… ninguém me chama de diogo
Tentativa e erro?!

Edição

Esse episódio foi editado pelo Johnny. Valeu Johnny!


Escute:

 

Twitter Mentions