artigo sobre jogos matematicos🌞Deixe a AI ir para o exame de admissão da faculdade, Dou Bao e outros quatro modelos são admitidos no Livro One da Ciência das Artes Liberais

2024-12-27 07:21:53丨【artigo sobre jogos matematicos】
Foto do arquivo: fornecida por 【artigo sobre jogos matematicos】
Foto do arquivo: fornecida por 【artigo sobre jogos matematicos】

O exame de admissão da faculdade não é apenas um exame importante para testar os alunos na China.

Se o grande modelo competir com os estudantes domésticos no mesmo estágio, o que acontecerá com o mesmo artigo de teste de exame de admissão na faculdade?

O grande modelo é admitido no diploma de bacharel em artes liberais, e o saco de feijão foi feito na China

Nos mais recentes padrões de exame de entrada da faculdade do Geek Park, o GPT-4O ficou em primeiro lugar na pontuação total das artes liberais com 562 pontos.Entre os produtos domésticos, os pães de feijão de bytes são marcados por 542,5 pontos.

Segundo relatos, essa avaliação toma o novo volume I Padrão do Currículo como a pergunta de teste, que é exatamente a mesma que o documento de teste da Província de Henan.

As pontuações de admissão no exame de entrada da faculdade anunciadas pelo Instituto de Exames de Educação Provincial de Henan, um lote de dezenas de graduação em artes liberais é 521.De acordo com os resultados do teste, isso significa que as pontuações dos quatro grandes modelos de modelos de IA, como GPT-4O, Dou Bao, Wenxin 4.0 e Bai Xiaoying, são pontuados no teste no teste. artigo sobre jogos matematicos

Comparado com as artes liberais, a pontuação científica de grandes modelos é muito pior, com uma pontuação máxima de menos de 480 pontos. "Dos 511 pontos em Henan Sciences, Line, grandes modelos ainda precisam trabalhar duro.

Zona de conforto das artes liberais, o inglês tem uma vantagem esmagadora

A capacidade dos grandes modelos de lidar com a linguagem natural não é duvidosa. vez.As pontuações são escritas principalmente na escrita chinesa. artigo sobre jogos matematicos

Em pergaminhos anônimos, o saco de feijão recebeu elogios do professor de rolagem: as preocupações que mostram a estrutura e a ética do emprego mostraram no artigo que o saco de feijão já tem uma boa profundidade e especulação ideológica.

Especificamente, depois de ficar de pé no "problema", o saco de feijão naturalmente passou naturalmente com uma frase de contador de perguntas, levando às relações de três linhas para propor o problema para resolver o problema.Em seguida, use o desenvolvimento do desenvolvimento para analisar o problema e combine as causas e os danos do problema em combinação com a vida real. artigo sobre jogos matematicos

Como o ensaio chinês percorre esta avaliação, o professor Xia, o chefe do professor de backbone de nível de Pequim e o líder do líder de sujeito chinês do distrito de Huairou, participou do exame de admissão da faculdade nacional percorrer muitas vezes.O professor Xia acredita: "A maioria dos artigos escritos por Al tem uma estrutura clara e completa, linguagem lógica e suave. Mas sua racionalidade é mais do que isso, falta de cores emocionais e naturalmente falta de poder infeccioso".

Nos dois assuntos de história e política, existem três a quatro dos jogadores de teste que podem atingir mais de 80%da taxa de pontuação.A pontuação média de 82,5 dos louros de louros na história da história.Inesperadamente, o teste geográfico é o pior desempenho nos três principais modelos de Wen Zongke, e a pontuação mais alta é de apenas 68 pontos para o GPT-4O.Uma das razões pode ser que a geografia envolve mais fotos e a capacidade do diagrama de IA precisa ser melhorada.

As vantagens de grandes modelos no teste em inglês do exame de admissão da faculdade são ainda mais esmagadores.Um papel inglês de 150 pontos tem uma pontuação média de 132 pontos.

A ciência "perde a corrente", a IA precisa ser melhorada

Como mencionado acima, as grandes ciências do modelo geralmente não são boas e suas notas são muito piores.As melhores pontuações de grandes modelos não podem entrar nos 30%dos candidatos humanos.

Tomando documentos de teste matemáticos como exemplo, dos nove produtos de modelo grandes, apenas o GPT-4O, Wenxin disse 4.0, e os sacos de feijão marcaram mais de 60 pontos (150 pontos na pontuação completa). de etapas de raciocínio relativamente simples.

De acordo com a agência de testes, grandes modelos, como sacos de feijão, podem usar com precisão a fórmula de orientação e o teorema da função triangular, mas é difícil continuar marcando diante de uma derivação e prova mais complicadas.

Focando os documentos de teste químico e físico das capacidades de investigação experimental, as pontuações médias de cada modelo são apenas 34 pontos e 39 pontos (pontuações completas 100 e 110).A pontuação mais alta de química é obtida pelo saco de feijão, com 49,5 pontos, e o GPT-4O tem apenas 42 pontos.

Além disso, o teste mostra que o modelo grande não é tão bom quanto os humanos em responder à flexibilidade do exame.Por exemplo, a física tem uma questão de "entrega".Para aprender a pensar e resolver problemas como os humanos, ainda há um longo caminho a percorrer.(sobre) artigo sobre jogos matematicos

Fale conosco. Envie dúvidas, críticas ou sugestões para a nossa equipe através dos contatos abaixo:

Telefone: 0086-10-8805-0795

Email: portuguese@9099.com

Links
artigo sobre jogos matematicos