Do Bit ao Yottabyte: O que é Big Data e o que são os Data Centers?

Do Bit ao Yottabyte: O que é Big Data e o que são os Data Centers?

Seja bem-vindo a mais um capítulo da série Do Bit ao Yottabyte, onde analisamos as principais inovações tecnológicas que moldam nossa sociedade. Hoje, vamos falar sobre o Big Data, um conceito fundamental para entender como dados são coletados, processados e utilizados para transformar tudo, desde redes sociais até serviços de saúde. 

Vale ressaltar que análise de Big Data revolucionou a forma como organizações e indivíduos interagem com a informação, permitindo a extração de padrões e insights a partir de volumes massivos de dados.

Prepare-se para descobrir sobre o funcionamento técnico desta tecnologia, aplicações práticas em redes sociais como o Instagram, integração com inteligência artificial, e os desafios éticos, ambientais e sociais associados.


O Que é Big Data?

O termo Big Data refere-se ao gigantesco volume de dados gerados a cada segundo no mundo digital. Basicamente, o Big Data refere-se ao conjunto de tecnologias e metodologias para processar e analisar dados em escala massiva, caracterizados pelos "5Vs": 

  • Volume (quantidade de dados gerados), 
  • Velocidade (taxa de produção e processamento), 
  • Variedade (formato estruturado, semiestruturado ou não estruturado), 
  • Veracidade (confiabilidade dos dados) e 
  • Valor (potencial para gerar insights úteis). 

Por exemplo, redes sociais como o Instagram lidam diariamente com petabytes de dados, incluindo fotos, comentários e interações em tempo real, que exigem infraestrutura especializada para armazenamento e análise destes dados. A análise desses dados permite identificar padrões, prever tendências e tomar decisões mais informadas em diversas áreas, como marketing, segurança, saúde e tecnologia.

Vale destacar que os dados vêm de diversas fontes e não apenas das redes sociais, incluindo: Transações financeiras, Sensores de dispositivos IoT, Registros médicos e Pesquisas na internet. Algumas pessoas acreditam que os dados se resumem ao nome, cpf, endereço, mas não, por este motivo, vamos abrir um destaque aqui para falar um pouco mais sobre esse assunto.


Qual a principal diferença entre Dados comuns e Dados sensíveis?

De forma resumida, podemos dizer que a principal diferença entre dados comuns (como nome, endereço, etc.) e dados sensíveis (como reconhecimento facial, digitais, emoções) reside no seu potencial de causar discriminação e danos à privacidade.

Dados comuns

  • Finalidade: Identificação geral e contato.
  • Risco de privacidade: Baixo, geralmente utilizados para fins administrativos e de comunicação.
  • Exemplos: Nome, endereço, telefone, e-mail, etc.

Dados sensíveis

  • Finalidade: Identificação única e detalhada, análise comportamental e emocional.
  • Risco de privacidade: Alto, podem revelar informações íntimas e gerar discriminação e preconceito.
  • Exemplos:
    • Reconhecimento facial: Identificação biométrica através de características faciais.
    • Digitais: Identificação biométrica através das impressões digitais.
    • Emoções: Análise de expressões faciais e tom de voz para identificar emoções.
    • Dados de saúde: Histórico médico, informações genéticas, etc.
    • Orientação sexual: Preferências sexuais e identidade de gênero.
    • Origem étnica: Informações sobre raça e etnia.
    • Opiniões políticas: Ideologias e posicionamentos políticos.

Entender essa diferença é essencial e conhecer a legislação de proteção de dados do nosso país é o primeiro passo. Saiba que a Lei Geral de Proteção de Dados (LGPD) no Brasil, estabelece medidas de segurança e consentimento mais rigorosas para o tratamento de dados sensíveis, devido ao seu maior potencial de causar danos à privacidade e discriminação.


Como o Big Data funciona?

O processamento do Big Data ocorre em várias etapas, vamos conhecer algumas dessas etapas:

  1. Coleta de Dados – Dados comuns e sensíveis são capturados de múltiplas fontes, como interações em redes sociais, sensores IoT e transações online. No Instagram, cada like, comentário ou visualização de story é registrado.
  2. Processamento – Dados brutos são limpos e transformados em formatos utilizáveis. Ferramentas como Apache Spark distribuem essa carga em clusters de servidores.
  3. Armazenamento – Sistemas como bancos NoSQL (ex: Cassandra) ou data centers globais armazenam informações. A Meta utiliza sharding para distribuir dados entre servidores físicos, garantindo escalabilidade.
  4. Análise – Algoritmos de machine learning (inteligência artificial) identificam padrões. Por exemplo, a Meta analisa histórico de navegação para segmentar anúncios.
  5. Visualização - Dashboards em ferramentas como Tableau traduzem insights em gráficos acessíveis para decisões estratégicas.
Aqui encontramos diversos conceitos interessantes, dentre eles, o conceito de Data Center, mas O que é um Data Center?

Data Center de Vinhedo é considerado o maior da América Latina
Data Center de Vinhedo é considerado o maior da América Latina

Um Data Center, também conhecido como centro de processamento de dados (CPD), é uma instalação física projetada para abrigar e operar uma grande quantidade de equipamentos de tecnologia da informação (TI), como servidores, storages, switches e roteadores. Esses equipamentos são responsáveis por armazenar, processar e distribuir dados e informações essenciais para o funcionamento de empresas, organizações e da internet como um todo.
Atualmente, o Brasil possui 181 data centers, representando 1,5% do número global de data centers, aponta o levantamento. Esse número é acima dos 172 do México, mas é bem menor do que os 517 da Alemanha ou os mais de 5,3 mil dos Estados Unidos. (Teletime)


Big Data nas Redes Sociais: O Caso da Meta (Instagram e Facebook)

Você já se perguntou como o Instagram recomenda publicações e anúncios que parecem feitos sob medida para você? Isso acontece porque a Meta (empresa dona do Instagram e Facebook) utiliza Big Data para analisar o comportamento dos usuários e personalizar a experiência.

Documentário O Dilema das Redes

A imagem acima foi extraída do Documentário O Dilema das Redes que está disponível na Netflix. Ao assisti-lo, você conseguirá entender um pouco sobre como as redes sociais estão manipulando as nossas mentes com seus algoritmos.

Como os dados são coletados?

A cada interação no Instagram – um like, um comentário, um tempo maior vendo um post – essas ações são registradas e enviadas para os servidores da Meta. Você já parou para pensar qual é o fluxo dos dados quando você (um simples usuário), morador de Manaus, acessa seu perfil no Instagram. Vamos analisar isso juntos?

Onde esses dados são armazenados?

Se um usuário em Manaus acessa seu perfil no Instagram, seus dados podem estar armazenados em um data center nos EUA. O caminho para acessar essas informações funciona assim:

  1. O usuário abre o Instagram no celular em Manaus.
  2. O aplicativo se conecta a servidores locais da Meta, possivelmente localizados em São Paulo, para reduzir latência.
  3. Caso os dados não estejam em cache regional, a requisição é encaminhada via cabos submarinos de fibra óptica para data centers nos EUA.
  4. A solicitação percorre cabos submarinos de fibra óptica até chegar ao data center nos EUA.
  5. O servidor da Meta recupera os dados, processa a solicitação e envia os dados de volta para o dispositivo do usuário em milissegundos, graças a protocolos de balanceamento de carga e Content Delivery Networks (CDNs)

Essa infraestrutura global garante que qualquer pessoa, em qualquer lugar, tenha acesso aos seus dados rapidamente. Ficou curioso? Acesse o Site Submarine Cable Map para visualizar os cabos submarinos registrados.

Mapa dos Cabos Submarinos

Para ver o Mapa dos Cabos de Manaus, acesse esse link https://www.submarinecablemap.com/landing-point/manaus-brazil


Big Data e Inteligência Artificial: O segredo por trás das recomendações

A Inteligência Artificial (IA) desempenha um papel fundamental na análise do Big Data. No caso do Instagram, a IA atua como um motor de análise do Big Data utilizando técnicas específicas como o Aprendizado Supervisionado que são modelos treinados com dados históricos para prever comportamentos do usuário; já o Processamento de Linguagem Natural (NPL) analisa textos de comentários para detectar sentimentos positivos e negativos para ajustar as campanhas e as Redes Neurais identificam os padrões visuais em fotos do Instagram para sugerir filtros ou anúncios personalizados. Tudo isso visando:

  • Recomendar conteúdos para você – Identificando quais posts podem interessar a você tendo como base o seu comportamento e o de outros usuários que possuem um perfil semelhante ao seu.

  • Personalizar anúncios para você, pois existem empresas pagam para exibir propagandas direcionadas para o público certo e muitas dessas propagandas são direcionadas para você com base no seu perfil e nos dados que foram extraídos do seu uso, ou seja, não é o Instagram que é o produto, o produto é você que está sendo vendido nos pregões virtuais. A empresa que paga mais aparece na sua tela.

  • Detectar comportamento suspeito – Identificando atividades fraudulentas e discursos de ódio.


Vamos abrir um parênteses aqui para falar um pouco mais sobre Publicidade Direcionada da Meta.
  • Coleta de Dados: A Meta rastreia atividades no Instagram, Facebook e terceiros (ex: sites com pixel do Facebook).
  • Treinamento de Modelos: Algoritmos são alimentados com dados das publicações (fotos, textos, reels, stories) além de likes e comentários e com isso, eles geram anúncios hiperpersonalizados.
  • Recomendação em Tempo Real: Sistemas como o Facebook Ads usam métricas de engajamento (CTR, conversões) para otimizar campanhas dinamicamente, ou seja, se você quiser vender produtos para mulheres entre 18 e 30 anos, basta você ajustar as ferramentas empresariais e dizer quanto você está disposto a pagar para que esse público receba sua propaganda. Uma coisa você pode ter certeza: A sua propaganda não irá aparecer para o público masculino.

Desafios Éticos, Ambientais e Sociais do Big Data

Apesar dos benefícios, o Big Data traz desafios significativos:

1. Privacidade e Segurança

  • Os dados coletados pelas redes sociais podem ser usados de maneira inadequada. Vazamentos e uso indevido de informações pessoais são preocupações constantes.
  • Usuários muitas vezes desconhecem que suas fotos públicas são usadas para treinar IA. A Meta permite opt-out via configurações de privacidade, mas o processo é pouco divulgado. Recentemente, descobriu-se que a Meta usou as fotos publicadas pelos usuários para treinar sua IA.
  • Casos como Cambridge Analytica mostraram como microdirecionamento de anúncios pode influenciar eleições. 
Para este último caso, recomendamos que assista ao documentário Privacidade Hackeada que está disponível na Netflix para que você possa entender como as empresas, grupos políticos e poderosos usam as redes sociais para manipular a opinião das pessoas.

2. Impacto Ambiental

  • Os gigantescos data centers consomem uma enorme quantidade de energia para processar e armazenar dados. Empresas estão investindo em soluções mais sustentáveis, mas o consumo ainda é alto.
  • Já ouviu falar do termo Dark Data? Saiba que 60% dos dados armazenados por empresas são inúteis, gerando custos ambientais equivalentes a 6.4 milhões de toneladas de CO2/ano. Atualmente, Data Centers consomem ~1% da energia global e a Dark Data emite mais CO2 que 80 países individualmente.

3. Exclusão Digital

  • Nem todas as pessoas têm acesso a essa tecnologia. O uso do Big Data para personalização pode aumentar desigualdades, deixando comunidades sem conectividade fora das oportunidades digitais.
  • Sistemas de recrutamento baseados em Big Data podem perpetuar discriminações, como desfavorecer minorias em processos seletivos.


O Futuro do Big Data

O Big Data continuará evoluindo e se integrando cada vez mais à nossa vida. Algumas tendências incluem:

  • Maior integração com IA Modelos cada vez mais inteligentes que analisam dados com precisão impressionante.
  • Computação QuânticaNovas tecnologias que podem revolucionar a análise de grandes volumes de dados.
  • Regulamentação mais rígidaLeis de privacidade mais rigorosas para proteger os usuários.

Conclusão

O Big Data já está transformando o mundo, desde redes sociais até pesquisas científicas. Entretanto, desafios como privacidade, impacto ambiental e exclusão digital precisam ser debatidos. Compreender essa tecnologia é essencial para garantir que ela seja usada de forma ética e acessível para todos.

Vale destacar que o Big Data redefine possibilidades tecnológicas, mas seu uso exige equilíbrio entre inovação e responsabilidade. Organizações precisam adotar políticas transparentes de coleta de dados, investir em eficiência energética e combater vieses algorítmicos. Paralelamente, usuários devem ser educados sobre direitos digitais, assegurando que avanços tecnológicos não perpetuem desigualdades ou degrade ainda mais a mente humana.

Se você quer continuar explorando as tendências tecnológicas do século XXI, fique de olho na série Do Bit ao Yottabyte.


Acesse todos os artigos da Série do Bit ao Yottabyte

{getCard} $type={post} $title={Arquivo da Série}

{getCard} $type={post} $title={Tendências Tecnológicas}


Como referenciar este texto: 

Blog do Lab de Educador. Do Bit ao Yottabyte: O que é Big Data e o que são os Data Centers? Zevaldo Sousa. Publicado em: 23/02/2025. Link da Postagem: https://blog.labdeeducador.com.br/2025/02/do-bit-ao-yottabyte-o-que-e-big-data-e-o-que-sao-os-data-centers.html. {codeBox}

Gostou deste conteúdo? Compartilhe suas opiniões e experiências nos comentários e acompanhe nossas redes sociais para mais dicas e informações práticas!


Referências:

ANATEL GOV.BR. Cabos Submarinos. Disponível em: <https://www.gov.br/anatel/pt-br/dados/infraestrutura/cabos-submarinos>. Acesso em: 2025.

CETAX. Big Data: O que é, conceito e definição (2024)Disponível em: <https://cetax.com.br/big-data/>. Acesso em: 23 de fev. 2025.

EXAME. Big data: armazenamento de dados inúteis tem custo e afeta o meio ambienteDisponível em: <https://classic.exame.com/tecnologia/armazenamento-de-dados-inuteis-gera-custos-e-prejudica-o-meio-ambiente/>. Acesso em: 2025.

GISMODO. Novo gerador de imagens por IA da Meta usou 1,1 bilhão de fotos do Instagram e do FacebookDisponível em: <https://gizmodo.uol.com.br/novo-gerador-de-imagens-por-ia-da-meta-usou-11-bilhao-de-fotos-do-instagram-e-do-facebook/>. Acesso em: 23 de fev. 2025.

GOOGLE CLOUD. Google Cloud Big Data and Machine Learning Fundamentals. Disponível em: <https://www.cloudskillsboost.google/course_templates/3>. Acesso em: 2025.

IBM. O que é Big Data Analytcs. Disponível em: <https://www.ibm.com/br-pt/topics/big-data-analytics>Acesso em: 23 de fev. 2025.

NETFLIX. Filme O dilema das redesDisponível em: <https://www.netflix.com/br/title/81254224>Acesso em: 23 de fev. 2025.

NETFLIX. Filme Privacidade HackeadaDisponível em: <https://www.netflix.com/br/title/80117542>Acesso em: 23 de fev. 2025.

TELETIME. Brasil é atrativo para data centers em meio ao boom da IA, indica SantanderDisponível em: <https://teletime.com.br/17/07/2024/brasil-e-atrativo-para-data-centers-em-meio-ao-boom-da-ia-indica-santander/>Acesso em: 23 de fev. 2025.

TELEGEOGRAPHY. Submarine Cable Map. Disponível em: <https://www.submarinecablemap.com/>. Acesso em: 2025.

TECNOBLOG. Como funcionam os cabos submarinos [Mapas e Tubarões]Disponível em: <https://tecnoblog.net/responde/como-funcionam-os-cabos-submarinos/>. Acesso em: 2025.

VORECOL. Desafios éticos na utilização de big data e análise de dadosDisponível em: <https://honestivalues.com/pt/blogs/blog-desafios-eticos-na-utilizacao-de-big-data-e-analise-de-dados-45793>. Acesso em: 23 de fev. 2025.+

🗨️ Adoramos ouvir você!

💡 Compartilhe sua opinião sobre este conteúdo. Seu feedback é muito importante para nós e nos ajuda a melhorar cada vez mais.

📣 O que achou? Tem algo a acrescentar?
Deixe seu comentário abaixo e participe da conversa!

Postagem Anterior Próxima Postagem