Você tem grandes volumes de transações e precisa consolidar essas informações? ou aplicar transformações nesses dados? O Apache Spark através de sua solução de processamento de dados via Structured Stream provê uma API simples para implementar o processamento de dados em "tempo real" de forma altamente escalável. Nessa apresentação vou mostrar como utilizamos o Structured Stream para processar mais de 100 milhões de transações de tentativas de tarifação por dia, apresentarei nossa arquitetura e alguns aspectos que sobre Streams usando Apache Spark que poderão te ajudar na tarefa de trabalhar e transformar grandes volumes de informação.
Eiti Kimura Coordenador de TI, Movile
Eiti Kimura é Coordenador de TI e Arquiteto de Sistemas Distribuídos de alto desempenho na Movile Brasil. Eiti tem 16 anos de experiência em desenvolvimento de software. É entusiasta de tecnologias open-source, e é MVP do Apache Cassandra desde 2014 e tem vasta experiência com sistemas de backend, em especial plataformas de tarifação para as principais operadoras de telefonia do Brasil. Eiti possuí mestrado em engenharia elétrica e especialização em engenharia de software, além de palestrar internacionalmente em eventos como Strata Hadoop World, Spark Summit, Cassandra Summit e RedisConf.
Um panorama das principais ferramentas e o que há de mais de novo em Data Science/Engineering no Google Cloud
Fernando Ultremare CTO, Dextra
A passionate software craftsman who's worked for a wide range of industries and products. Open source developer, technical writer and conference speaker. At Dextra, I blend my technical and management skills to lead teams that are building awesome software products for startups, technology, media, manufacturing, financial and other types of companies. I live in Brazil and graduated in Computer Science at the University of Campinas, Unicamp. When my head is not on computers, I love the countryside where I really enjoy riding horses and playing guitar out loud.
Índice de Audiência Musical é a composição de várias tecnologias de computação musical, computação em Nuvem e Data Science para consolidar, num único número, o nível de popularidade de artistas, baseando-se em dados de consumo em rádios, TVs e plataformas de streaming. Nessa palestra, contaremos detalhes desse projeto, utilizado pela Rede Globo para a escolha de artistas do programa SóTocaTop.
Daniel Cukier CTO, Playax
Pai da Laura, CTO na Playax. PhD em Ciência da Computação na USP e professor de JavaScript sênior na Laboratoria. Google Developer Expert (GDE) e meditador Vipassana
Com o objetivo de recontar uma história a partir de textos, imagens e vídeos, o projeto temático Fapesp DéjàVu reúne diversas técnicas de aprendizado de máquina e visão computacional para organizar e recriar eventos, contando toda a história em diversas perspectivas. Esta palestra foca em provenance analysis, um braço importante do projeto, e como ela pode ser utilizada no combate a fake news.
Alexandre Mello Ferreira Researcher, IC/Unicamp
Possuo doutorado em Ciência da Computação pela Politecnico di Milano, Itália (2013), mestrado em Ciência da Computação pela Universidade Federal de São Carlos (2008) e bacharelado em Ciência da Computação pela Escola de Engenharia de Piracicaba (2004). Desde 2015 atuo como pesquisador no RECOD (IC, Unicamp) em diversos projetos ligados direta ou indiretamente aos temas computação forense e aprendizado de máquina. Estes projetos são financiados pela iniciativa privada e agências de fomento. Além da pesquisa, também sou docente na Fatec Campinas e na Escola de Engenharia de Piracicaba nos cursos de computação.
Nesta sessão vou apresentar a criação do Apache Spark a partir do zero, instanciando uma máquina no Azure e permitindo a interação com linguagem R, incluindo os mecanismos de Machine Learning integrado com Big Data.
Diego Nogare Chief Data Officer, Lambda3
Diego Nogare é graduado em Ciência da Computação, Pós-Graduado em Engenharia da Computação com ênfase em Desenvolvimento Web com .Net. Mestrando em Engenharia Elétrica e Computação. Autor de quatro livros em Português: Do Banco de Dados Relacional à Tomada de Decisão, SQL Server Além do Conceito: Blog Post Collection, SQL Server Além do Conceito: Volume 2 e Análise Preditiva com Azure Machine Learning e R. É Microsoft Most Valuable Professional [MVP] em Data Platform desde 2008, e em 2017 mudou de categoria para Artificial Intelligence. Também foi Regional Mentor do PASS nos anos de 2014 e 2015, Regional Advisor para área da América Latina no PASS entre 2015 e 2016, e PASS Board Director at Large nos anos de 2018 e 2019. Investe um tempo palestrando em eventos da Microsoft e do PASS, e quando consegue, escreve para o blog: www.diegonogare.net
Como ferramentas de ingestão e streaming em paralelo podem antecipar análises no Pipeline de Big Data e diminuir a movimentação dos dados após a persistência, garantindo agilidade na aplicação de Modelos de Big Data.
Erros de algoritmos "mal treinados" levam a conclusões erradas: desde a identificação de gorilas em fotos de humanos até a prisão de inocentes. Neste cenário, qual papel nós estamos desempenhando? Estamos ajudando a reforçar e a replicar algoritmos tendenciosos (biased)?
Davi Silva Gerente de Projetos, Dextra
Desenvolvedor com experiência em projetos de desenvolvimento de software no Brasil e EUA, onde atuei como desenvolvedor nos laboratórios Bell Labs/Lucent. Antes da Dextra fui head de tecnologia e arquitetura em uma operadora de Telecom, principal executivo de uma fundação de pesquisa em TI e Segurança de Informação, e atuei em uma Fintech. Tenho 4 filhos, dois cachorros e jogo Squash. Compartilho algumas idéias em PapoDeCafe.com e meu Twitter é @DaviSilva.
Um sistema de recomendação é uma espécie de sistema de filtragem de informações que procura prever a "classificação" ou "preferência" que um determinado usuário dará a um item ou serviço. Hoje em dia eles se tornaram cada vez mais populares e estão presentes nas mais diversas áreas, incluindo filmes, músicas, notícias, livros, artigos de pesquisa, consultas de pesquisa e produtos em geral. Nessa palestra vou mostrar diferentes implementações de sistemas de recomendação em diferentes ferramentas, programando em Python e utilizando ferramentas disponíveis via Google Cloud Plataform (tais como TensorFlow e Cloud Machine Learning Engine), demonstrando diferentes técnicas, trazendo estudos de caso de mundo real tais como recomendação de filmes dentre outros.
Ahirton "Einstein" Lopes Data Scientist, Duratex
Data Scientist na Duratex e professor de MBA em Machine Learning e Inteligência Artificial na FIAP além de community manager na AI Brasil. Apaixonado por aprendizagem, startups, psicologia e inovação em geral, é mestre em Engenharia Elétrica pela Universidade Presbiteriana Mackenzie (UPM) e doutorando em Engenharia Elétrica e Computação na mesma instituição. Seus projetos tiveram como temas principais: Motores de Recomendação, Auto Organização e Funcionamento Autônomo de VANTs, Processamento de Linguagem Natural dentre outros tópicos.
Nesta palestra, apresentarei uma introdução prática sobre as principais técnicas de sistemas de recomendação, incluindo arquiteturas recentes baseadas em Deep Learning. Serão apresentados exemplos utilizando Python, TensorFlow e Google ML Engine, e fornecidos datasets para exercitarmos um cenário de recomendação de artigos e notícias.
Gabriel Moreira Lead Data Scientist, CI&T
Gabriel Moreira é um cientista apaixonado por dados e Machine Learning. Ele também é aluno de doutorado no ITA, com pesquisa focada em Arquiteturas de Deep Learning para Sistemas de Recomendação. Na CI&T, lidera um time de Data Scientist e ML Engineers na transformação de jornadas digitais utilizando Cognitive.
O objetivo é abordar a tecnologia serverless em conjunto com um grande volume de requisições e dados. Além disso, mostrar a relação custo x benefício de cada abordagem se faz necessário para que o custo também seja uma preocupação dos Arquitetos e Desenvolvedores ao pensar em uma solução deste porte.
Flávio Pimenta Arquiteto Cloud e Evangelista Devops, Assertiva Soluções
Arquiteto Cloud e Evangelista DevOps na Assertiva Soluções Formado em Matemática pela UNICAMP, com mais de 18 anos no mercado de TI atuando como desenvolvedor Java e também com experiência em CI/CD e Cloud Computing. Sou coordenador das comunidades AWS Campinas e Qualidade de Software Campinas.
Aprenda como a utilizar o Google Dataflow e Google BigQuery para processar seu grande volume de dados juntamente com Dataflow SDK e Apache Beam com uso de cron jobs no Google App Engine de forma a automatizar suas pipelines de dados
Como utilizar o ambiente Azure para processamento de dados utilizando features de Big Data, como Cluster Apache Hadoop, Spark entre outras features.
Cristiano Joaquim dos Santos Coordenador de BI/Big Data e Banco de Dados, Sestini
Cristiano Joaquim, formado em Ciência da Computação pela Universidade de Guarulhos e Pós Graduado em BI pela Faculdade IBTA. Professor Universitário em Cursos de Tecnologia e Profissional de TI com no momento 19 anos de experiência em diversos ramos de atividades, como: Varejo e Atacarejo, Logística, Financeiras e prestação de serviços por meios de pagamentos.
Falar sobre como ensinamos os computadores a ver e interpretar o mundo, e como a disponibilidade de dados vem modificando isso. Posso mostrar os exemplos em que trabalho atualmente (em minha empresa, ONG e doutorado) e também o que vêm acontecendo na academia e no mercado.
Como criar, validar e colocar modelos de Machine Learning em produção utilizando arquiteturas serverless na nuvem.
Felipe Santos Data Scientist, Daitan Group
Sou doutor em física e desde o início da graduação me fascinava a ideia de aplicar o mindset de físico em problemas "sociais" - como urbanização, comportamentos, linguagens, etc. Naturalmente, esse interesse me levou a ciência de dados, área pela qual sou absolutamente apaixonado. Tenho experiência tanto no desenvolvimento quanto no deploy de modelos baseados em machine learning com finalidades diversas, mas o que faz meus olhos brilharem é aplicar essas técnicas em problemas relacionados a urbanização, linguagens ou análises comportamentais.
Everton Gago Especialista em Data Science, Dextra
Everton Gago é Doutorando e Mestre em Engenharia Elétrica na Unicamp. Atualmente pesquisa e desenvolve algoritmos matemáticos que reproduzem de forma artificial os aspectos biológicos de aprendizado e auto-organização. Seus principais interesses são: Aprendizado de máquina, processamento digital de sinais e computação evolutiva
Qual o objetivo maior de suas linhas de código? Você realmente necessita de um Schema forte, inter relacionado, vinculado a chaves inflexíveis? O quão estável está o seu business? Já foi validado e já produz os resultados esperados?
Alline Oliveira CTO, CreBit
Alline Oliveira é uma das poucas mulheres no mundo certificada como Google Developer Expert, devido a seu trabalho em Cloud Computing. Já desenvolveu para Nike, Citibank, Qualcomm, Departamento de Defesa Americano, Universidade da California, TAM, Anatel, Serpro, dentre outros. Hoje é a CTO da fintech Crebit.