Topic de jugement-GPT :

Chat GPT de plus en plus conne

Je viens de tester en effet GPT 3.5 commence à prendre le dessus sur 4.

Légende : Icône verte = GPT 3.5 / Icône violette = GPT 4

Énigme des fils:
https://image.noelshack.com/fichiers/2023/30/2/1690314530-screenshot-2023-07-25-at-21-45-39-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314539-screenshot-2023-07-25-at-21-45-47-chatgpt.png

Math basique:
https://image.noelshack.com/fichiers/2023/30/2/1690314517-screenshot-2023-07-25-at-21-47-17-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314523-screenshot-2023-07-25-at-21-47-00-chatgpt.png

(une énigme que j'ai inventée pour l'occasion, donc il a pas pu trouver sur le net la réponse):
https://image.noelshack.com/fichiers/2023/30/2/1690314891-screenshot-2023-07-25-at-21-53-58-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314884-screenshot-2023-07-25-at-21-54-31-chatgpt.png

3.5 plus rapide en terme de réponse sur les trois questions, et plus pertinent visiblement pour la question 2.
À savoir que j'avais posé ces trois mêmes questions il y a quelques mois et ils étaient tout deux incapables de répondre correctement à celle du prénom des fils et de l'âge. Donc y a un peu de progrès quand même.
Par contre ils ne savent toujours pas interpréter correctement le sens de nuit blanche.

Désolé pour la faute saurez = saurais et milles = mille :noel:

Le 25 juillet 2023 à 21:57:29 :
Je viens de tester en effet GPT 3.5 commence à prendre le dessus sur 4.

Légende : Icône verte = GPT 3.5 / Icône violette = GPT 4

Énigme des fils:
https://image.noelshack.com/fichiers/2023/30/2/1690314530-screenshot-2023-07-25-at-21-45-39-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314539-screenshot-2023-07-25-at-21-45-47-chatgpt.png

Math basique:
https://image.noelshack.com/fichiers/2023/30/2/1690314517-screenshot-2023-07-25-at-21-47-17-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314523-screenshot-2023-07-25-at-21-47-00-chatgpt.png

(une énigme que j'ai inventée pour l'occasion, donc il a pas pu trouver sur le net la réponse):
https://image.noelshack.com/fichiers/2023/30/2/1690314891-screenshot-2023-07-25-at-21-53-58-chatgpt.png
https://image.noelshack.com/fichiers/2023/30/2/1690314884-screenshot-2023-07-25-at-21-54-31-chatgpt.png

3.5 plus rapide en terme de réponse sur les trois questions, et plus pertinent visiblement pour la question 2.
À savoir que j'avais posé ces trois mêmes questions il y a quelques mois et ils étaient tout deux incapables de répondre correctement à celle du prénom des fils et de l'âge. Donc y a un peu de progrès quand même.
Par contre ils ne savent toujours pas interpréter correctement le sens de nuit blanche.

Dans le langage courant, une "nuit blanche" désigne une nuit pendant laquelle une personne ne dort pas du tout. Cela peut être dû à des raisons diverses, comme le travail, les études, l'insomnie, ou des activités sociales. Cette expression est souvent utilisée dans le contexte où quelqu'un reste éveillé toute la nuit pour terminer un travail ou un projet, ou lorsqu'elle passe toute la nuit à faire la fête ou à regarder des films.

Le 25 juillet 2023 à 22:01:07 :
https://image.noelshack.com/fichiers/2023/30/2/1690315265-image.png

Du coup son raisonnement est aléatoire.

Le 25 juillet 2023 à 22:02:18 :

Le 25 juillet 2023 à 22:01:07 :
https://image.noelshack.com/fichiers/2023/30/2/1690315265-image.png

Du coup son raisonnement est aléatoire.

j'ai beau réactualiser elle me donne toujours 18. Mais notre prompt dans sa construction est différent

On constate l'intelligence ou les lacunes de chat gpt en discutant avec, en voyant comment il prend en compte l'ensemble d'une conversation, c'est quand même extrêmement réducteur de le juger sur des énigmes et des maths :doute:
C'est surtout pour le bridage sur les articles scientifiques qui m'emmerde. Je me suis abonné pour avoir du contenu scientifique avec la possibilité d'être sourcé par des travaux, maintenant ça pue la merde.
Faut pas se leurrer, le moratoire de 6 mois voulu par certain est appliqué sous la forme de bridage. Historiquement, ce sera vu comme de l'obscurantisme. Et à l'inverse, celui qui sortira une version non-bridée remportera le marché instantanément.
Prévisible, ils veulent faire des économies (du profit) en réduisant le coût d'inférence du modèle.

Le 25 juillet 2023 à 21:22:13 jugement-gpt a écrit :
De mon coté je constate une amélioration quant à la pertinence des résultats

Tout l'inverse pour moi. J'ai en effet observé une dégradation des qualité des résultats. Et je suis pas le seul.

Dans des instructions je demande explicitement d'éviter tel mot par exemple, et l'IA ignore totalement l'instruction.

Problème de finance à résoudre

Sur une période du 1er septembre au 31 décembre

Résultat : chatgpt calcule sur 3 mois :)

"Tu es sur? Revérifie tes calculs"

Il me refait sur 3 mois :)

Je me suis désabonné :ok:
Faudrait comparer à Bing Chat vos résultats https://image.noelshack.com/fichiers/2018/29/6/1532128784-risitas33.png

Le 25 juillet 2023 à 22:33:05 :
Faudrait comparer à Bing Chat vos résultats https://image.noelshack.com/fichiers/2018/29/6/1532128784-risitas33.png

BingChat est dévelopé également par OpenIA

a force de patch woke, l'ia a perdu toute cohérence :rire:
Même constat que vous mes bons kheys et même déception. https://image.noelshack.com/fichiers/2020/04/2/1579621953-cavill-clope.png

Le 25 juillet 2023 à 22:33:05 :
Faudrait comparer à Bing Chat vos résultats https://image.noelshack.com/fichiers/2018/29/6/1532128784-risitas33.png

Bing Chat est basé sur la structure chat GPT.

Microsoft a développé ça en partenariat avec OpenIA. On peut dire que c'est OpenIA qui a intégré chatGPT dans bing

N'espérez pas un contrepoids avec Bard car bard c'est encore plus de la merde que GPT 3.5

Aya je suis pas le seul à avoir eu cette impression :rire:

Ravi d'avoir pu en profiter avant qu'ils ne brident :rire:

Données du topic

Auteur
jugement-GPT
Date de création
25 juillet 2023 à 21:15:33
Nb. messages archivés
48
Nb. messages JVC
48
En ligne sur JvArchive 220