O que Todo Dev Deve Saber sobre Forense Digital: Coleta de Evidências, Chain of Custody e Análise

Fundamentos da Forense Digital Forense digital é a ciência de descobrir, preservar, analisar e apresentar evidências encontradas em dispositivos digitais de forma a manter sua integridade e viabilidade legal. Diferentemente da forense tradicional, onde trabalhamos com evidências físicas, aqui nos deparamos com dados voláteis, complexos e frequentemente distribuídos. Uma evidência digital pode desaparecer em milissegundos se não for coletada corretamente, ou ser invalidada legalmente se a cadeia de custódia for quebrada. O objetivo principal é reconstruir eventos digitais sem alterar ou contaminar os dados originais. Isso significa que cada ação que executamos durante a investigação deve ser documentada, rastreável e reproduzível. Diferente de uma investigação criminal tradicional, onde você fotografa uma cena de crime uma única vez, em forense digital você pode (e deve) coletar os mesmos dados múltiplas vezes para validar suas descobertas, desde que mantenha a integridade dos dados originais. Por que a Forense Digital é Crítica A maioria das investigações criminosas, fraudes corporativas e incidentes de segurança

Fundamentos da Forense Digital

Forense digital é a ciência de descobrir, preservar, analisar e apresentar evidências encontradas em dispositivos digitais de forma a manter sua integridade e viabilidade legal. Diferentemente da forense tradicional, onde trabalhamos com evidências físicas, aqui nos deparamos com dados voláteis, complexos e frequentemente distribuídos. Uma evidência digital pode desaparecer em milissegundos se não for coletada corretamente, ou ser invalidada legalmente se a cadeia de custódia for quebrada.

O objetivo principal é reconstruir eventos digitais sem alterar ou contaminar os dados originais. Isso significa que cada ação que executamos durante a investigação deve ser documentada, rastreável e reproduzível. Diferente de uma investigação criminal tradicional, onde você fotografa uma cena de crime uma única vez, em forense digital você pode (e deve) coletar os mesmos dados múltiplas vezes para validar suas descobertas, desde que mantenha a integridade dos dados originais.

Por que a Forense Digital é Crítica

A maioria das investigações criminosas, fraudes corporativas e incidentes de segurança deixam rastros digitais. Uma máquina pode armazenar semanas de atividade do usuário em seus logs, metadados e caches. Criminosos podem tentar destruir evidências digitais muito mais facilmente do que evidências físicas — um comando simples pode limpar gigabytes de dados. Por isso, a coleta rápida, precisa e documentada é essencial. Sem forense digital adequada, você pode perder a única conexão entre um suspeito e um crime.

Princípios Fundamentais

O primeiro princípio é a não alteração de dados originais. Você não trabalha nunca diretamente com a evidência original; sempre cria cópias forenses certificadas. O segundo é a documentação completa de cada passo tomado. O terceiro é a reprodutibilidade: qualquer outro forense deve ser capaz de seguir seu trabalho e chegar às mesmas conclusões. Por fim, a cadeia de custódia deve ser ininterrupta desde o momento da coleta até a apresentação em juízo.

Coleta de Evidências: Metodologia e Prática

A coleta inadequada de evidências é a razão número um pela qual casos são perdidos em tribunal. Um USB coletado sem hash inicial, um disco rígido desligado de forma abrupta, ou um arquivo modificado por acidente durante o processo de cópia — qualquer um desses erros pode render uma evidência inadmissível.

Preparação do Ambiente

Antes de tocar em qualquer dispositivo, você precisa de um ambiente seguro e controlado. Isso significa um local isolado de redes, com acesso físico restrito e ferramentas validadas. Prepare uma máquina forense limpa — idealmente um laptop ou computador dedicado que você controla completamente. Tenha em mãos drives externos certificados (preferencialmente novos ou zerados), kits de escrita bloqueada, cabos adequados e documentação de baseline dos seus equipamentos.

A escolha das ferramentas é crítica. Use apenas software de código aberto ou comercial consagrado no mercado, como FTK Imager, Encase, ou dd (para Linux). Nunca use ferramentas caseiras ou duvidosas. Valide suas ferramentas antes de usá-las: crie uma imagem forense de teste, depois execute a mesma coleta novamente e compare os hashes. Se forem idênticos, sua ferramenta é confiável.

Processo de Captura de Imagem Forense

Uma imagem forense é uma cópia bit-a-bit do dispositivo, incluindo espaço não alocado, swap, e área livre. Não é um backup comum — é uma réplica perfeita do estado digital no momento da coleta. Você pode capturar em diferentes formatos: raw (dd), segmented (FTK), ou proprietário (Encase). O formato menos dependente é o raw, já que pode ser processado por qualquer software.

Aqui está um exemplo prático usando dd em Linux:

#!/bin/bash
# Script para coleta forense com documentação

DEVICE="/dev/sda"
OUTPUT_PATH="/mnt/external_drive"
CASE_NUMBER="CASE-2024-001"
EVIDENCE_ID="DISK-01"
DATETIME=$(date +"%Y%m%d_%H%M%S")

# Criar arquivo de log
LOG_FILE="${OUTPUT_PATH}/${CASE_NUMBER}_${EVIDENCE_ID}_${DATETIME}.log"

{
    echo "=== FORENSE DIGITAL - LOG DE COLETA ===" 
    echo "Data/Hora início: $(date)"
    echo "Caso: ${CASE_NUMBER}"
    echo "Evidência ID: ${EVIDENCE_ID}"
    echo "Dispositivo: ${DEVICE}"
    echo "Tamanho do dispositivo: $(blockdev --getsize64 ${DEVICE}) bytes"
    echo ""
} > "${LOG_FILE}"

# Capturar imagem com progresso
echo "[*] Iniciando captura de imagem forense..." | tee -a "${LOG_FILE}"

dd if="${DEVICE}" of="${OUTPUT_PATH}/${EVIDENCE_ID}.raw" bs=4096 conv=noerror,sync 2>&1 | tee -a "${LOG_FILE}"

# Gerar hash criptográfico (SHA-256)
echo "[*] Gerando hash SHA-256..." | tee -a "${LOG_FILE}"
SHA256=$(sha256sum "${OUTPUT_PATH}/${EVIDENCE_ID}.raw" | awk '{print $1}')
echo "SHA-256: ${SHA256}" | tee -a "${LOG_FILE}"

# Gerar hash MD5 para validação adicional
echo "[*] Gerando hash MD5..." | tee -a "${LOG_FILE}"
MD5=$(md5sum "${OUTPUT_PATH}/${EVIDENCE_ID}.raw" | awk '{print $1}')
echo "MD5: ${MD5}" | tee -a "${LOG_FILE}"

# Registrar dados de timestamp
echo ""
echo "Data/Hora fim: $(date)" >> "${LOG_FILE}"
echo "Tamanho da imagem: $(du -h ${OUTPUT_PATH}/${EVIDENCE_ID}.raw | cut -f1)" >> "${LOG_FILE}"

echo "[✓] Coleta concluída. Verifique: ${LOG_FILE}"

Este script coleta a imagem com dd, que é o padrão na indústria, e imediatamente gera hashes criptográficos. Os hashes são a prova de que a imagem é uma cópia exata do original.

Coleta de Dados Voláteis

Antes de desligar o computador, você pode perder dados críticos em memória RAM. Se a investigação é sobre malware em execução ou conexões ativas, você precisa capturar a memória. Use volatility em combinação com ferramentas de dump como dd apontado para /dev/mem (requer acesso root) ou memdump.

#!/bin/bash
# Captura de memória RAM

MEMORY_SIZE=$(free | grep Mem | awk '{print $2}')
MEMORY_FILE="/mnt/external/memory_dump_$(date +%s).raw"

echo "[*] Capturando ${MEMORY_SIZE}KB de memória RAM..."
dd if=/dev/mem of="${MEMORY_FILE}" bs=4096 conv=noerror,sync

echo "[*] Gerando hash da memória..."
sha256sum "${MEMORY_FILE}" > "${MEMORY_FILE}.sha256"

echo "[✓] Memória capturada em: ${MEMORY_FILE}"

Chain of Custody: Rastreamento Ininterrupto de Evidências

A cadeia de custódia é o documento que prova que uma evidência foi coletada, manuseada e armazenada de forma segura, sem alterações ou comprometimento. Se a cadeia de custódia quebra, a evidência se torna inadmissível em corte — não importa o quanto ela incrimine alguém. É o segundo elemento mais crítico após a integridade técnica dos dados.

Estrutura da Cadeia de Custódia

Um documento de cadeia de custódia deve incluir: data e hora exata da coleta, identificação única da evidência (case number + evidence ID), nome e assinatura de quem coletou, condições do dispositivo no momento da apreensão, hashes criptográficos iniciais, e um log detalhado de cada acesso subsequente. Cada pessoa que tocar na evidência deve registrar seu nome, data, hora, motivo do acesso, e confirmação de que os hashes continuam idênticos.

#!/usr/bin/env python3
# Sistema básico de rastreamento de Chain of Custody

import hashlib
import json
from datetime import datetime
from pathlib import Path

class ChainOfCustodyManager:
    def __init__(self, case_number, evidence_id):
        self.case_number = case_number
        self.evidence_id = evidence_id
        self.chain_log = {
            "case": case_number,
            "evidence_id": evidence_id,
            "events": []
        }

    def register_collection(self, collector_name, device_description, initial_hash):
        """Registra a coleta inicial da evidência"""
        event = {
            "timestamp": datetime.now().isoformat(),
            "action": "COLLECTION",
            "performed_by": collector_name,
            "device_description": device_description,
            "hash_sha256": initial_hash,
            "notes": ""
        }
        self.chain_log["events"].append(event)
        print(f"[✓] Coleta registrada por {collector_name}")

    def register_access(self, accessor_name, reason, hash_verification):
        """Registra um acesso à evidência com verificação de integridade"""
        event = {
            "timestamp": datetime.now().isoformat(),
            "action": "ACCESS",
            "performed_by": accessor_name,
            "reason": reason,
            "hash_verified": hash_verification,
            "notes": ""
        }
        self.chain_log["events"].append(event)
        print(f"[✓] Acesso registrado por {accessor_name}")

    def register_transfer(self, from_person, to_person, transfer_reason):
        """Registra a transferência de custódia entre dois indivíduos"""
        event = {
            "timestamp": datetime.now().isoformat(),
            "action": "TRANSFER",
            "from_person": from_person,
            "to_person": to_person,
            "reason": transfer_reason,
            "notes": ""
        }
        self.chain_log["events"].append(event)
        print(f"[✓] Transferência registrada: {from_person} → {to_person}")

    def save_log(self, output_path):
        """Salva o log em formato JSON para auditoria"""
        with open(output_path, 'w') as f:
            json.dump(self.chain_log, f, indent=2)

        # Gera hash do próprio log para validação
        with open(output_path, 'rb') as f:
            file_hash = hashlib.sha256(f.read()).hexdigest()

        print(f"[✓] Log salvo em: {output_path}")
        print(f"    Hash do log (SHA-256): {file_hash}")

    def print_chain(self):
        """Exibe a cadeia de custódia completa"""
        print("\n=== CADEIA DE CUSTÓDIA ===")
        print(f"Caso: {self.case_number}")
        print(f"Evidência: {self.evidence_id}\n")

        for i, event in enumerate(self.chain_log["events"], 1):
            print(f"{i}. [{event['action']}] {event['timestamp']}")
            if event['action'] == 'COLLECTION':
                print(f"   Coletado por: {event['performed_by']}")
                print(f"   Dispositivo: {event['device_description']}")
                print(f"   Hash inicial: {event['hash_sha256']}")
            elif event['action'] == 'ACCESS':
                print(f"   Acessado por: {event['performed_by']}")
                print(f"   Razão: {event['reason']}")
                print(f"   Hash verificado: {'✓' if event['hash_verified'] else '✗'}")
            elif event['action'] == 'TRANSFER':
                print(f"   De: {event['from_person']} → Para: {event['to_person']}")
                print(f"   Motivo: {event['reason']}")
            print()

# Exemplo de uso
if __name__ == "__main__":
    # Criar gerenciador de cadeia
    manager = ChainOfCustodyManager("CASE-2024-001", "DISK-001")

    # Registrar coleta inicial
    manager.register_collection(
        collector_name="Ana Silva (Perita Forense)",
        device_description="Samsung 1TB SSD, Serial: ABC123XYZ",
        initial_hash="a7f2c9e1d5b8f4a6e2c9d1f5a8b3e7c9"
    )

    # Simular accesso para análise
    manager.register_access(
        accessor_name="Carlos Santos (Analista)",
        reason="Análise de arquivos deletados",
        hash_verification=True
    )

    # Simular transferência de custódia
    manager.register_transfer(
        from_person="Ana Silva",
        to_person="Lucas Pereira (Armazenamento)",
        transfer_reason="Armazenamento seguro após coleta"
    )

    # Exibir e salvar
    manager.print_chain()
    manager.save_log("chain_of_custody.json")

Armazenamento Seguro da Evidência

Depois de coletada, a evidência deve ser armazenada em local seguro com temperatura controlada, longe de campos eletromagnéticos. Mantenha cópias em múltiplos locais (pelo menos uma cópia original + uma cópia de trabalho). Nunca trabalhe diretamente com a evidência original — sempre trabalhe com a cópia. Registre cada acesso ao armazenamento, inclusive quem entrou, quando, e por quanto tempo.

Análise Forense: Metodologia Prática

Agora que você tem a evidência coletada e a cadeia de custódia documentada, começa a fase de análise. Aqui você examina a imagem forense em busca de evidências de atividade maliciosa, padrões de comportamento, timestamps, metadados e qualquer coisa relevante para a investigação.

Análise de Imagem com Ferramentas Padrão

A abordagem mais comum é usar plataformas integradas como Autopsy (interface gráfica para Sleuth Kit) ou The Sleuth Kit linha de comando. Essas ferramentas entendem estruturas de sistema de arquivos e podem recuperar dados deletados.

#!/bin/bash
# Análise inicial de imagem forense usando The Sleuth Kit

IMAGE_FILE="DISK-01.raw"
OUTPUT_DIR="analysis_output"

mkdir -p "${OUTPUT_DIR}"

echo "[*] Analisando imagem forense: ${IMAGE_FILE}"

# 1. Determinar tipo de sistema de arquivos
echo "[*] Identificando sistema de arquivos..."
fsstat "${IMAGE_FILE}" > "${OUTPUT_DIR}/fsstat.txt"

# 2. Listar todos os arquivos (incluindo deletados)
echo "[*] Listando todos os arquivos (inodes)..."
fls -r "${IMAGE_FILE}" > "${OUTPUT_DIR}/all_files.txt"

# 3. Extrair informações de inodes específicos
echo "[*] Analisando inodes..."
istat "${IMAGE_FILE}" 1234 > "${OUTPUT_DIR}/inode_1234.txt"

# 4. Buscar por palavras-chave em dados brutos
echo "[*] Buscando por strings suspeitas..."
strings "${IMAGE_FILE}" | grep -i "password\|credit\|admin" > "${OUTPUT_DIR}/suspicious_strings.txt"

# 5. Analisar timeline de modificação de arquivos
echo "[*] Gerando timeline de eventos..."
mactime -b "${OUTPUT_DIR}/bodyfile.csv" \
    $(fls -r "${IMAGE_FILE}" 2>/dev/null) > "${OUTPUT_DIR}/timeline.txt" 2>/dev/null

echo "[✓] Análise concluída. Resultados em: ${OUTPUT_DIR}/"

Análise de Memória com Volatility

Se você capturou a memória RAM, a ferramenta padrão é Volatility. Ela permite você examinar processos em execução, conexões de rede ativas, dados de senhas, malware em memória, e muito mais.

#!/bin/bash
# Análise de dump de memória com Volatility 3

MEMORY_DUMP="memory_dump.raw"
PROFILE="Win10"  # Ajuste conforme o SO
OUTPUT_DIR="memory_analysis"

mkdir -p "${OUTPUT_DIR}"

echo "[*] Analisando dump de memória..."

# 1. Listar processos em execução no momento da captura
echo "[*] Extraindo processos..."
vol -f "${MEMORY_DUMP}" -p "${PROFILE}" windows.pslist > "${OUTPUT_DIR}/processes.txt"

# 2. Analisar conexões de rede ativas
echo "[*] Extraindo conexões de rede..."
vol -f "${MEMORY_DUMP}" -p "${PROFILE}" windows.netscan > "${OUTPUT_DIR}/network_connections.txt"

# 3. Extrair strings suspeitas da memória
echo "[*] Buscando strings na memória..."
vol -f "${MEMORY_DUMP}" -p "${PROFILE}" utility.strings > "${OUTPUT_DIR}/memory_strings.txt"

# 4. Analisar DLLs carregadas em memória
echo "[*] Analisando DLLs carregadas..."
vol -f "${MEMORY_DUMP}" -p "${PROFILE}" windows.dlllist > "${OUTPUT_DIR}/dlls.txt"

echo "[✓] Análise de memória concluída em: ${OUTPUT_DIR}/"

Análise de Logs e Artefatos

Um dos aspectos mais poderosos da forense é a análise de logs do sistema. Servidores, computadores pessoais e dispositivos móveis deixam rastros de quase tudo que fazem. Logs do Windows Event Viewer, syslogs do Linux, e logs de aplicação contêm timestamps, usuários responsáveis, e ações executadas.

#!/usr/bin/env python3
# Análise básica de logs do Windows Event Viewer (EVTX)

import struct
import json
from datetime import datetime, timedelta

class EventLogParser:
    """
    Parser simplificado para análise de padrões em logs.
    Em prática, use bibliotecas como python-evtx para parsing real.
    """

    def __init__(self):
        self.events = []

    def parse_sample_events(self):
        """Simula parsing de eventos do Windows"""
        # Em um cenário real, você parsearia arquivos EVTX reais
        sample_events = [
            {
                "timestamp": "2024-01-15T10:23:45Z",
                "event_id": 4688,
                "source": "Security",
                "message": "Processo criado: powershell.exe",
                "user": "DOMAIN\\attacker",
                "process_id": 5432
            },
            {
                "timestamp": "2024-01-15T10:24:12Z",
                "event_id": 4625,
                "source": "Security",
                "message": "Falha de login - conta desconhecida",
                "user": "Administrator",
                "process_id": 0
            },
            {
                "timestamp": "2024-01-15T10:25:33Z",
                "event_id": 4720,
                "source": "Security",
                "message": "Nova conta criada",
                "user": "DOMAIN\\attacker",
                "process_id": 0
            }
        ]
        return sample_events

    def analyze_suspicious_activity(self, events):
        """Identifica padrões suspeitos nos eventos"""
        suspicious_patterns = {
            4688: "Processo criado (possível execução maliciosa)",
            4625: "Falha de autenticação (força bruta?)",
            4720: "Conta criada (possível backdoor)",
            4722: "Conta habilitada",
            4724: "Tentativa de resetar senha"
        }

        analysis_results = []

        for event in events:
            event_id = event.get("event_id")
            if event_id in suspicious_patterns:
                result = {
                    "timestamp": event["timestamp"],
                    "event_id": event_id,
                    "description": suspicious_patterns[event_id],
                    "user": event.get("user"),
                    "severity": "HIGH" if event_id in [4688, 4720, 4724] else "MEDIUM"
                }
                analysis_results.append(result)

        return analysis_results

    def generate_report(self, analysis):
        """Gera relatório formatado"""
        report = {
            "report_generated": datetime.now().isoformat(),
            "total_suspicious_events": len(analysis),
            "events_by_severity": {
                "HIGH": len([e for e in analysis if e["severity"] == "HIGH"]),
                "MEDIUM": len([e for e in analysis if e["severity"] == "MEDIUM"])
            },
            "suspicious_events": analysis
        }
        return report

# Exemplo de uso
if __name__ == "__main__":
    parser = EventLogParser()

    # Simular parsing de eventos
    events = parser.parse_sample_events()
    print(f"[*] Processados {len(events)} eventos do log\n")

    # Analisar atividades suspeitas
    analysis = parser.analyze_suspicious_activity(events)

    # Gerar relatório
    report = parser.generate_report(analysis)

    print("=== RELATÓRIO DE ANÁLISE DE LOGS ===\n")
    print(f"Data do relatório: {report['report_generated']}")
    print(f"Total de eventos suspeitos: {report['total_suspicious_events']}\n")
    print(f"Eventos de severidade ALTA: {report['events_by_severity']['HIGH']}")
    print(f"Eventos de severidade MÉDIA: {report['events_by_severity']['MEDIUM']}\n")

    print("=== EVENTOS SUSPEITOS DETECTADOS ===\n")
    for event in report['suspicious_events']:
        print(f"[{event['timestamp']}] Severidade: {event['severity']}")
        print(f"  ID: {event['event_id']} | Usuário: {event['user']}")
        print(f"  Descrição: {event['description']}\n")

    # Salvar relatório em JSON
    with open("forensic_analysis_report.json", "w") as f:
        json.dump(report, f, indent=2)
    print("[✓] Relatório salvo em: forensic_analysis_report.json")

Validação de Integridade Durante a Análise

A cada passo da análise, você deve re-validar os hashes das evidências. Se houver discrepâncias, a evidência foi comprometida. Use a prática de hash em cascata: calcule o hash da imagem original, depois de cada cópia, e durante a análise.

#!/bin/bash
# Validação contínua de integridade forense

validate_forensic_integrity() {
    local evidence_file=$1
    local original_hash=$2

    local current_hash=$(sha256sum "${evidence_file}" | awk '{print $1}')

    if [ "${current_hash}" = "${original_hash}" ]; then
        echo "[✓] Integridade validada"
        echo "    Hash: ${current_hash}"
        return 0
    else
        echo "[✗] ALERTA: Integridade comprometida!"
        echo "    Hash esperado: ${original_hash}"
        echo "    Hash atual:    ${current_hash}"
        return 1
    fi
}

# Validar em múltiplos pontos da investigação
EVIDENCE="DISK-01.raw"
ORIGINAL_HASH="a7f2c9e1d5b8f4a6e2c9d1f5a8b3e7c9"

echo "=== VALIDAÇÃO DE INTEGRIDADE FORENSE ==="
validate_forensic_integrity "${EVIDENCE}" "${ORIGINAL_HASH}"

Conclusão

Neste artigo, você aprendeu que forense digital não é apenas sobre encontrar culpados — é sobre preservar a verdade técnica de forma que seja reconhecida legalmente. Três pontos críticos resumem tudo: primeiro, a coleta correta com hashes criptográficos é inegociável; sem ela, sua evidência desmorona em corte. Segundo, a cadeia de custódia documentada é o que transforma uma descoberta técnica em prova judicial — cada assinatura, cada timestamp, cada verificação de hash importa. Por fim, a análise metódica e reproduzível demonstra profissionalismo e credibilidade; você não é um investigador particular amador, você é um cientista digital cujo trabalho pode envidar alguém para a prisão ou inocentar um acusado.

A prática regularmente. Configure seu próprio ambiente de laboratório com imagens de teste (baixe disk images públicas para praticar), execute coletas múltiplas, valide seus processos, e documente tudo. Quanto mais você praticar antes de um caso real, mais natural e confiável será seu trabalho quando a pressão vier.

Referências

NIST Special Publication 800-86: Guide to Integrating Forensic Techniques into Incident Response
https://nvlpubs.nist.gov/nistpubs/Legacy/SP/nistspecialpublication800-86.pdf
The Sleuth Kit Official Documentation: Open source digital investigation tools
https://www.sleuthkit.org/
Volatility Foundation: Advanced memory forensics framework
https://www.volatilityfoundation.org/
SANS Institute Forensic Certifications: Definitive resource for chain of custody and best practices
https://www.sans.org/cyber-aces/
Linux Kernel Documentation on Filesystem Internals: Understanding ext4, NTFS, and other filesystems in depth
https://www.kernel.org/doc/html/latest/filesystems/index.html

O que Todo Dev Deve Saber sobre Forense Digital: Coleta de Evidências, Chain of Custody e Análise Já leu