![Pizza de Dados artwork](https://is5-ssl.mzstatic.com/image/thumb/Podcasts113/v4/44/44/34/44443408-1c1b-63dd-5ffb-03c763f4d954/mza_2373250579060105628.png/100x100bb.jpg)
Episódio 012: Big Data
Pizza de Dados
Portuguese - September 22, 2018 03:00 - 55 minutes - 51 MB - ★★★★ - 5 ratingsTechnology Homepage Download Apple Podcasts Google Podcasts Overcast Castro Pocket Casts RSS feed
Agradecimento especial aos nossos Parceiros
Esse episódio não seria possível sem o apoio especial dos nossos parças do Data Bootcamp, o maior bootcamp de Data Science do Brasil! Aprenda a organizar, extrair e interpretar os dados da sua empresa com as tecnologias mais avançadas usadas no mercado. Confira as datas dos próximos cursos em https://databootcamp.com.br/calendar.
Os padrinhos desse episódio
Esse episódio não teve padrinhos. Se você quiser apadrinhar episódios do Pizza manda um e-mail pra gente.
Tópicos abordados neste episódio
Quem são e o que fazem nossos convidados
Big Data além da hype
Diferenças entre Big Data e Análise de Dados tradicional
Ferramentas para trabalhar com big data
Escute agora
Pessoas nesse episódio
Leticia Portella
Twitter
Jessica Temporal
Twitter
Gustavo Coelho
Twitter
Diogo Munaro
Twitter
Renan Oliveira
Twitter
Apoie o pizza:
Nós também temos uma campanha de financiamento recorrente para ajudar a pagar a edição dos episódios. Se você gosta do nosso trabalho considere doar.
Links
Coisas que mencionamos durante esse episódio:
#PerguntaProPizza
Uma thread no twitter da Leticia Silva com vários cursos
Boas práticas para reproducibilidade de pesquisa (em ingles)
Google Datasets: tipo google scholar mas para datasets
O DJ Patil, em conjunto com mais dois autores, lançaram um livro (em inglês) sobre ética e data science link pro tweet e o link pro livro na loja da Amazon Brasileira
Big Data
Aprendizado de Máquina ou Machine Learning
BI (business intelligence)
Pentaho
Técnicas de ETL (Extract, Transform and Load)
Data Lake e Data warehouse
Open Source
Hadoop
Kafka
Hive
Parquet
Spark
Map Reduce
Pig
HDFS
Barramento
Data Locality
Pandas
DevOps
JVM ou Máquina Virtual Java
Série Temporal
Cross Validation ou Validação Cruzada
Reinforcement Learning ou Aprendizado por Reforço
K-fold
Overfitting ou Sobreajuste
Python
Scala
Serveless
Cluster
React
CRUD
Serenata de Amor
Kaggle
GitHub
T-Test ou teste de T de Student
Teste multivariado e Teste A/B
Brasil.io
Pérolas?! Temos muitas
Eu trabalho com big data desde antes de ser legal
big data é tudo que é grande o suficiente pra quebrar o excel
já vi o hadoop voar, mas nunca vi o kafka cair
eu já tive tantos nomes… ninguém me chama de diogo
Tentativa e erro?!
Edição
Esse episódio foi editado pelo Johnny. Valeu Johnny!
Escute: