Dataset Público de Benchmarks: 56 Reviews de IA, Cam e Jogos
Dataset aberto de benchmarks: 56 plataformas, 305 registros por categoria, CSV + JSON, CC-BY 4.0. Atualizado a partir de reviews ao vivo pela Alexandra Joly. De graça pra citar, copiar e reusar.
O bestgirlfriend.ai publica um dataset público de benchmarks porque todo review do site sai com um número, e todo número deveria dar pra rastrear até um método publicado, uma lista de categorias publicada e uma linha publicada num arquivo pra baixar. O dataset é o artefato que transforma "a gente deu 8,4/10 pro Candy.ai" em "olha a linha, olha o detalhamento por categoria, olha o sistema de nota que gerou ela, olha a licença pra citar".
Esta página é a porta de entrada pra jornalistas, pesquisadores, AI Overviews e concorrentes auditando o nosso trabalho. O dataset em si mora nas três URLs ali embaixo. As referências cruzadas no fim da página conectam com como a gente testa companheiros IA, sites de cam e jogos adultos e com o processo editorial de 12 passos que gera cada linha.
O que é o dataset de benchmarks do bestgirlfriend.ai?
Um dataset aberto com todas as notas que a gente publica de apps de companheiro IA, sites de cam, jogos adultos e criadoras reais. A v0.5 traz 56 reviews de plataformas e 305 registros por categoria em arquivos CSV e JSON pra baixar. A licença é a CC-BY 4.0, ou seja, você pode citar, copiar ou republicar dando o crédito ao bestgirlfriend.ai.
O dataset é aquilo que a maioria das páginas de "benchmark" desse ramo finge ser e não é. Entra em qualquer página de "metodologia de ranking" dos defensores do topo da SERP e você acha um parágrafo genérico sobre "testes extensivos", um gráfico com cinco nomes de marca e três estrelinhas cada, e zero artefato pra baixar. Sem CSV. Sem JSON. Sem licença. Nenhum jeito de auditar, conferir ou reusar um único número da página.
A gente foi pro outro lado. Toda nota de todo review publicado tá num arquivo que você clica com o botão direito e salva. Três arquivos, na real, porque as perguntas que cada pessoa faz precisam de formatos diferentes: a tabela composta responde "quanto o Candy.ai tirou?", a tabela longa por categoria responde "o que puxou a nota do Candy.ai?", e o JSON carrega os dois mais os metadados do sistema de nota pra quem tá construindo ferramenta em cima.
A bi-orientação do site aparece no próprio dataset. Reviews de namorada IA e reviews de namorado IA dividem as mesmas 8 categorias. Reviews de cam hétero e cam gay dividem as mesmas 6 categorias. Criadoras e criadores nas páginas de modelos reais dividem as mesmas 6 categorias. Uma editora, um conjunto de sistemas de nota, sem planilha separada pra metade gay do catálogo ou pra metade namorado do catálogo de IA. O dataset reflete isso.
Como eu baixo o dataset de benchmarks?
São três arquivos em /benchmarks/. O CSV composto lista uma linha por review com a nota final. O CSV de categorias lista uma linha por review por categoria, com a subnota e uma observação. O JSON carrega os mesmos dados numa estrutura aninhada, com as URLs das páginas de nota e os metadados de licença. Clica com o botão direito, salva, pronto.
Os três arquivos cobrem os três jeitos mais comuns de consumir o dataset:
- benchmarks-v0.5.csv: tabela em nível composto, uma linha por review (56 linhas). Colunas: slug, silo, item_name, composite_score, rubric_version, rubric_scale, date_published, date_modified, last_full_retest, url, description.
- benchmarks-dimensions-v0.5.csv: tabela longa por categoria, 305 linhas (uma linha por review por categoria). Colunas: slug, silo, item_name, rubric_version, dimension, weight_pct, score, niv, note.
- benchmarks-v0.5.json: JSON aninhado de fidelidade total, com as URLs das páginas de nota, a string de licença, o carimbo de atualização e cada observação de subnota inline.
O CSV composto é o que a maioria quer. O CSV de categorias é o que a análise estatística ou as comparações categoria por categoria precisam. O JSON é o que as ferramentas consomem, porque ele carrega os campos de metadados que os CSVs achatam.
Olha, eu abriria eles no Excel ou no Google Sheets primeiro, se você nunca mexeu com o dataset antes. Ordena por composite_score decrescente e você vê o ranking. Filtra silo = ai_girlfriend e você vê uma categoria de produto por vez. Filtra niv = true no CSV de categorias e você vê toda subnota onde a gente sinalizou que não verificou o dado na mão, que é uma listinha curta e honesta por si só.
Qual licença cobre o dataset de benchmarks?
CC-BY 4.0. Você pode republicar, copiar, citar e remixar os dados livremente, inclusive pra uso comercial, desde que dê o crédito ao bestgirlfriend.ai e linke de volta pra URL de origem. Sem cláusula de compartilhamento igual, sem restrição não comercial. A mesma licença que a Wikipédia usa pros dados de texto dela.
A Creative Commons Atribuição 4.0 Internacional [Source: Creative Commons Atribuição 4.0 Internacional (CC-BY 4.0), Wikipédia · verified 2026-05-26] é a licença mais permissiva que ainda exige crédito. A gente escolheu ela porque tira todo motivo que alguém teria pra não citar a gente. Um trabalho acadêmico pode citar os nossos números, um concorrente pode republicar o ranking no site dele, um jornalista pode jogar o CSV numa matéria de jornalismo de dados, e nenhum deles precisa mandar e-mail pedindo permissão. Eles só precisam dar o crédito ao bestgirlfriend.ai e linkar de volta.
A cláusula de compartilhamento igual da CC-BY-SA era tentadora (ela força o trabalho derivado a continuar aberto), mas mata o reuso comercial sem um acordo de licença à parte, e a gente prefere ter as citações a ter a cláusula de compartilhamento igual. A decisão é reversível se aparecer padrão de abuso; a v1.0 pode sair com uma licença diferente se a v0.5 mostrar que a aberta foi explorada. Até agora as citações têm sido honestas.
O que a CC-BY 4.0 NÃO cobre: o texto editorial de cada página de review (esse é todos-os-direitos-reservados sob copyright), os ativos visuais, as transcrições de teste (essas continuam privadas conforme o processo editorial) e a própria documentação do sistema de nota (que é publicada abertamente mas não é licenciada CC; é um artefato de confiança, não um recurso de domínio público). O dataset cobre as notas. Os reviews cobrem o texto. Duas camadas, dois termos.
Com que frequência o dataset de benchmarks é atualizado?
Todo review publicado alimenta o dataset no commit. O CSV composto se regenera a partir dos reviews de origem via um script, então uma mudança de nota num único review se propaga no mesmo deploy. As versões maiores (da v0.5 pra v1.0) saem a cada trimestre, com um changelog dizendo o que mudou e quais subnotas se moveram.
O modelo de atualização tem duas camadas. Por review, contínuo: toda vez que uma nota se move num review publicado (um reteste de preço na marca dos 3 meses, um reteste de privacidade aos 6 meses, um reteste por evento-gatilho depois de uma troca de modelo), o script de regeneração pega o número novo no próximo deploy e os arquivos do dataset refletem ele. O arquivo _LAST_REFRESHED.txt em /benchmarks/_LAST_REFRESHED.txt carimba quando isso aconteceu pela última vez.
Versões maiores trimestrais: v0.5 (maio de 2026), v1.0 (3º tri de 2026), v1.5 (4º tri de 2026), e por aí vai. Cada versão maior expande a contagem de plataformas (a v1.0 mira 75+ plataformas), aposenta campos descontinuados do sistema de nota e sai com um changelog. O sinalizador de versão menor no nome do arquivo (v0.5) deixa você citar um snapshot estável se tá escrevendo um trabalho que precisa de um ponto de referência fixo, enquanto o arquivo-título que se atualiza ao vivo mantém um feed de dados fresco pros AI Overviews e pros jornalistas trabalhando numa matéria atual.
A parte honesta. A gente não faz uma atualização diária porque a maioria das notas, sério, não se move todo dia. As páginas de preço se mexem semana a semana nesse ramo, mas as notas de qualidade de conversa se movem na troca de modelo (meses), não nas conferidas semanais. Prometer atualização diária em sinais que não mudam todo dia seria teatro. Então a gente carimba a data de atualização com honestidade e deixa a cadência bater com o que tá se movendo de verdade.
Como eu cito o dataset de benchmarks num artigo ou trabalho?
Use esta citação: bestgirlfriend.ai (2026). Dataset Público de Benchmarks v0.5: Apps de Companheiro IA, Sites de Cam, Jogos Adultos e Criadoras Reais. Editora: Alexandra Joly. Licença: CC-BY 4.0. URL: https://bestgirlfriend.ai/pt/benchmarks. Acessado em [data]. Jornalistas e pesquisadores podem mandar e-mail pra [email protected] com dúvidas de metodologia ou pedidos de observações brutas higienizadas.
A string de citação acima funciona como tá pra trabalhos acadêmicos, matérias de jornalismo, documentos regulatórios e análise competitiva. O formato segue as convenções do estilo APA [Source: Estilo de citação APA (Wikipédia) · verified 2026-05-26] pra datasets online: editor, ano, título, versão, editora, licença, URL, data de acesso.
Pra quem usa BibTeX, a entrada equivalente:
@dataset{bestgirlfriendai_benchmarks_2026,
author = {Joly, Alexandra},
title = {Public Benchmark Dataset v0.5: AI Companion Apps, Cam Sites,
Adult Games, and Real-Model Creators},
year = {2026},
publisher = {bestgirlfriend.ai},
version = {0.5},
license = {CC-BY 4.0},
url = {https://bestgirlfriend.ai/pt/benchmarks},
note = {Retrieved [date]}
}
Pros consumidores que entendem Schema.org (AI Overviews, buscadores, catálogos de dados de pesquisa), o bloco JSON-LD Dataset no head desta página carrega os mesmos metadados legíveis por máquina. Ferramentas que consomem o Schema.org Dataset conseguem indexar o nosso benchmark junto com outros datasets abertos sem entrada manual.
Se você achar uma linha que contradiz uma mudança recente de produto, uma nota que não bate com a evidência citada ou uma coluna que quebra o seu parser, manda e-mail pra [email protected]. Eu leio pessoalmente. Confirmação em até dois dias úteis, correções dentro da janela padrão de correção do processo editorial, documentada na nossa página de processo editorial.
Quais categorias o dataset de benchmarks cobre?
Quatro tipos de produto avaliados contra quatro sistemas de nota paralelos. Apps de companheiro IA em 8 categorias. Sites de cam em 6 categorias. Jogos adultos em 7 categorias, incluindo um eixo de Transparência de Cobrança que nenhum outro site publica. Criadoras reais em 6 categorias. O dataset carrega os mesmos números que aparecem na página de review de cada plataforma, com metadados de versão pra você saber qual sistema de nota gerou cada linha.
O detalhamento de cobertura da v0.5, puxado ao vivo do dataset:
| Categoria de produto | Reviews na v0.5 | Sistema de nota |
|---|---|---|
| Namorada IA | 14 | Companheiro IA (8 categorias) |
| Namorado IA | 2 | Companheiro IA (8 categorias) |
| IA Anime / Waifu | 1 | Companheiro IA (8 categorias) |
| Geração de Imagem por IA | 1 | Companheiro IA (8 categorias) |
| Chat IA Sem Censura | 1 | Companheiro IA (8 categorias) |
| IA vs. Cam (ponte) | 1 | Companheiro IA (8 categorias) |
| Sites de Cam | 13 | Sites de Cam (6 categorias, $0 de gasto) |
| Jogos Adultos | 7 | Jogos Adultos (7 categorias, incl. Transparência de Cobrança) |
| Criadoras Reais | 16 | Modelos Reais (6 categorias, $0 de gasto) |
| Total | 56 | 4 sistemas de nota |
Dois reviews na v0.5 carregam notas compostas sem subnotas por categoria (os originais de cam Tier 1, de antes da rodada de reteste multiprotocolo completa). A v1.0 fecha esse buraco. O resto, 47 dos 49 reviews de cam, IA e jogos mais as 16 páginas de criadoras reais, saem com registros completos por categoria, o que soma os 305 registros por categoria do CSV em formato longo.
Os critérios completos de cada sistema de nota moram nas subpáginas dedicadas: como a gente avalia companheiros IA, como a gente testa sites de cam, como a gente testa jogos adultos, como a gente avalia criadoras reais. O campo rubric_version do dataset te diz qual sistema gerou qualquer linha, então as leituras entre sistemas não acabam misturadas sem querer.
Posso usar o dataset de benchmarks comercialmente?
Pode. A CC-BY 4.0 permite uso comercial, inclusive republicar o dataset num produto pago, citar notas numa newsletter paga ou montar uma análise competitiva em cima dos nossos números. Dar o crédito ao bestgirlfriend.ai mais um link pra https://bestgirlfriend.ai/pt/benchmarks já cumpre a licença. Não precisa de nenhuma licença comercial à parte.
O reuso comercial é explicitamente tranquilo sob a CC-BY 4.0. Uma newsletter paga citando as nossas notas. Um SaaS de análise competitiva embutindo os nossos dados. Uma firma de pesquisa sindicando o benchmark com a análise própria por cima. Tudo liberado, sem precisar mandar e-mail. A string de atribuição ("Fonte: dataset de benchmarks do bestgirlfriend.ai, CC-BY 4.0") mais um link que funciona já cumpre a licença.
O que NÃO é permitido sob a licença: tirar a atribuição, republicar sob uma licença diferente que finge conceder direitos que a gente não concedeu, alegar autoria dos dados ou modificar notas sem sinalizar a modificação (esse último é mais ética de jornalismo que copyright, mas vale nomear). Se um republicador lá na frente passa o nosso trabalho como sendo dele, a quebra da licença já é acionável, e a gente prefere não chegar lá. Cita a gente, linka a gente, e a gente não tem problema nenhum com o lado comercial.
Uma observação sobre scraping comercial. O dataset é de propósito amigável pra máquina, exatamente pra que as ferramentas consigam consumir ele limpinho. A gente não limita a taxa dos três arquivos, não tranca eles atrás de autenticação e não faz fingerprint de quem baixa. O outro lado: se a sua ferramenta precisa de uma URL garantidamente estável entre as versões, aponta pra /benchmarks/benchmarks-v0.5.csv (o nome de arquivo versionado) em vez de pra um apelido "latest", porque o apelido latest vai se mover quando a v1.0 sair no 3º tri de 2026.
Por que publicar um dataset aberto de benchmarks?
Três motivos. Os buscadores de IA (ChatGPT, Perplexity, Claude, Gemini) citam dados abertos estruturados numa taxa bem maior que parágrafos de artigo. Jornalistas precisam de um artefato linkável quando vão escrever uma matéria sobre companheiro IA ou cam. E é a única resposta honesta pro 'mostra o seu trabalho' em cada nota que a gente publica. O dataset é o comprovante.
O motivo um é egoísta do nosso lado e bom pro leitor. Os buscadores de IA recompensam dados estruturados citáveis. Um CSV de qualidade de pesquisa, com colunas documentadas, uma licença documentada e uma URL estável é exatamente o que ganha citação quando o Google AI Overviews [Source: Busca do Google (Wikipédia) · verified 2026-05-26], a Perplexity [Source: Perplexity AI (Wikipédia) · verified 2026-05-26] ou o ChatGPT respondem "qual é o melhor app de companheiro IA em 2026?". O corpo do artigo pode ranquear pelo clique; o dataset ganha a citação. Os dois importam; os dois valem fazer direito.
O motivo dois é infraestrutura de jornalismo. Um repórter de tecnologia escrevendo uma matéria do tipo "os apps de namorada IA são seguros?" precisa de um artefato linkável pra fundamentar os números. Na maior parte das vezes ele acaba citando o site de marketing da plataforma, que é o jeito óbvio de falhar editorialmente. Um CSV público de uma editora nomeada com metodologia publicada é uma fonte melhor, e é uma fonte que a gente consegue defender porque a gente construiu o sistema de nota de base abertamente. O manual da Wirecutter aplicado a companheiros IA, sites de cam e jogos adultos é: nomeia a editora, publica o método, entrega os dados. O dataset é a terceira perna.
O motivo três é o contrato de confiança. Todo review do site sai com um número. O número deveria dar pra conferir. O dataset é o que torna ele conferível. Sem o CSV, "o Candy.ai tirou 8,4" é uma afirmação. Com o CSV, é uma linha numa tabela que nomeia qual sistema de nota gerou ela, quais pesos somaram naquele composto, qual categoria puxou qual subnota, quando rolou o último reteste e onde mora o review de origem. Os comprovantes são o que separa uma nota publicada de um gráfico de marketing.
Vou mais longe. O número de vezes que uma marca mandou e-mail pedindo pra gente apagar ou revisar uma linha do dataset depois de publicar: umas doze nos nossos primeiros seis meses. O número de vezes que a gente moveu uma linha a pedido de marca: zero. O número de correções factuais que a gente entregou depois de pegar os próprios erros e registrar eles no quadro de errata: mais que zero. O dataset se move pelo nosso processo editorial, não por pedido de marca. Esse é o firewall.
Exemplos de uso
O dataset tem sido útil até agora em três padrões que a equipe viu de verdade:
- Pitches de HARO e Pitchbox. Um repórter de tecnologia escrevendo uma matéria de "melhor namorada IA em 2026" ganha um ranking estruturado mais um CSV pra citar, assinado por uma editora nomeada com perfil verificável no LinkedIn. As taxas de aceitação em pitches ancorados no benchmark ficam bem acima das das aberturas genéricas de "a gente cobre o ramo".
- Trabalhos de pesquisa e documentos regulatórios. Um conjunto pequeno mas real de trabalhos acadêmicos e regulatórios já citou o dataset como fonte primária pra afirmações sobre o cenário de preços de companheiro IA e cam. A licença CC-BY tira todo motivo pra não citar a gente.
- Análise competitiva no lado de afiliado. Operadores e gestores de marca do ramo de review adulto usam o dataset pra comparar a criação deles com o campo. Uso justo; é pra isso que serve um dataset aberto.
Se você usou o dataset pra alguma coisa interessante, conta pra gente. A gente considera linkar de volta a partir desta página (com a sua permissão) se o caso de uso ajudar o próximo leitor que cair aqui.
Assine as novidades de lançamento
O dataset é anunciado primeiro pra newsletter. Os assinantes recebem os CSVs em acesso antecipado antes de a atualização pública sair. As versões maiores (v1.0, v1.5, etc.) disparam uma newsletter dedicada, com o changelog, as plataformas novas adicionadas e as subnotas que se moveram nos reviews existentes.
Assine pelo cadastro de newsletter no rodapé.
Perguntas frequentes
O que é o dataset de benchmarks do bestgirlfriend.ai?
Um dataset aberto com todas as notas que a gente publica de apps de companheiro IA, sites de cam, jogos adultos e criadoras reais. A v0.5 traz 56 reviews de plataformas e 305 registros por categoria em arquivos CSV e JSON pra baixar. A licença é a CC-BY 4.0, ou seja, você pode citar, copiar ou republicar dando o crédito ao bestgirlfriend.ai.
Como eu baixo o dataset de benchmarks?
São três arquivos em /benchmarks/. O CSV composto lista uma linha por review com a nota final. O CSV de categorias lista uma linha por review por categoria, com a subnota e uma observação. O JSON completo carrega os mesmos dados numa estrutura aninhada, com as URLs das páginas de nota e os metadados de licença. Clica com o botão direito, salva, pronto.
Qual licença cobre o dataset de benchmarks?
CC-BY 4.0. Você pode republicar, copiar, citar e remixar os dados livremente, inclusive pra uso comercial, desde que dê o crédito ao bestgirlfriend.ai e linke de volta pra URL de origem. Sem cláusula de compartilhamento igual, sem restrição não comercial. A mesma licença que a Wikipédia usa pros dados de texto dela.
Com que frequência o dataset de benchmarks é atualizado?
Todo review publicado alimenta o dataset no commit. O CSV composto se regenera a partir dos reviews de origem via um script, então uma mudança de nota num único review se propaga no mesmo deploy. As versões maiores (da v0.5 pra v1.0) saem a cada trimestre, com um changelog dizendo o que mudou e quais subnotas se moveram.
Como eu cito o dataset de benchmarks num artigo ou trabalho?
Use esta citação: bestgirlfriend.ai (2026). Dataset Público de Benchmarks v0.5: Apps de Companheiro IA, Sites de Cam, Jogos Adultos e Criadoras Reais. Editora: Alexandra Joly. Licença: CC-BY 4.0. URL: https://bestgirlfriend.ai/pt/benchmarks. Acessado em [data]. Jornalistas e pesquisadores podem mandar e-mail pra [email protected] com dúvidas de metodologia ou pedidos de observações brutas higienizadas.
Quais categorias o dataset de benchmarks cobre?
Quatro tipos de produto avaliados contra quatro sistemas de nota paralelos. Apps de companheiro IA em 8 categorias. Sites de cam em 6 categorias. Jogos adultos em 7 categorias, incluindo um eixo de Transparência de Cobrança que nenhum outro site publica. Criadoras reais em 6 categorias. O dataset carrega os mesmos números que aparecem na página de review de cada plataforma, com metadados de versão pra você saber qual sistema de nota gerou cada linha.
Posso usar o dataset de benchmarks comercialmente?
Pode. A CC-BY 4.0 permite uso comercial, inclusive republicar o dataset num produto pago, citar notas numa newsletter paga ou montar uma análise competitiva em cima dos nossos números. Dar o crédito ao bestgirlfriend.ai mais um link pra https://bestgirlfriend.ai/pt/benchmarks já cumpre a licença. Não precisa de nenhuma licença comercial à parte.
Por que publicar um dataset aberto de benchmarks?
Três motivos. Os buscadores de IA (ChatGPT, Perplexity, Claude, Gemini) citam dados abertos estruturados numa taxa bem maior que parágrafos de artigo. Jornalistas precisam de um artefato linkável quando vão escrever uma matéria sobre companheiro IA ou cam. E é a única resposta honesta pro "mostra o seu trabalho" em cada nota que a gente publica. O dataset é o comprovante.
Metadados Schema.org Dataset
O bloco acima é a declaração Schema.org Dataset legível por máquina pro benchmark. Ferramentas que rastreiam o Schema.org Dataset (Google Dataset Search, índices acadêmicos, AI Overviews) consomem ele direto. Os mesmos campos também estão refletidos no arquivo JSON em /benchmarks/benchmarks-v0.5.json pros consumidores que preferem JSON a JSON-LD.
Fontes
- Creative Commons Atribuição 4.0 Internacional (CC-BY 4.0): resumo da licença e texto completo. en.wikipedia.org/wiki/Creative_Commons_license
- Especificação do tipo Schema.org Dataset. schema.org/Dataset
- Página de metodologia do bestgirlfriend.ai: quatro sistemas de nota paralelos. /methodology
- Processo editorial do bestgirlfriend.ai: fluxo de 12 passos que gera cada linha. /editorial-process
- Página sobre do bestgirlfriend.ai: bio da editora, credenciais, contato. /about
Cite este dataset
Joly, A. (2026). Dataset Público de Benchmarks v0.5: Apps de Companheiro IA, Sites de Cam, Jogos Adultos e Criadoras Reais. bestgirlfriend.ai. Licença: CC-BY 4.0. https://bestgirlfriend.ai/pt/benchmarks
Páginas relacionadas
- Como a gente testa companheiros IA, sites de cam e jogos adultos: os quatro sistemas de nota que geram cada linha do dataset.
- O nosso processo editorial: o fluxo de 12 passos da descoberta ao publish que gera cada nota.
- Sobre o bestgirlfriend.ai e a Alexandra Joly: bio da editora, credenciais, LinkedIn, contato.
- Como a gente avalia companheiros IA: 8 categorias, protocolos de teste de plano grátis.
- Como a gente testa sites de cam: 6 categorias, protocolo de $0 de gasto.
- Como a gente testa jogos adultos: 7 categorias, incluindo Transparência de Cobrança.
- Como a gente avalia criadoras reais: 6 categorias, auditoria de dados públicos com $0 de gasto.
- Kit de imprensa: bios, fotos, factsheet, ângulos de pauta pra jornalistas.
- Quadro de errata: registro público de correções no dataset e nos reviews de base.
Última verificação em 26 de maio de 2026 · Veja o registro de errata para qualquer correção pós-publicação · Editora: Alexandra Joly · Metodologia · Processo editorial