Il m'est arrivé un truc bizarre.
La transformation d'un communiqué de presse de natif vers un pdf est parfois foireuse au niveau de la mise en page (selon le logiciel de départ et l'OS). Dès lors, quand on veut sélectionner l'argumentaire, c'est un peu à saute mouton, du genre sélection à trous avec le titre et le 2é paragraphe, mais pas le premier. Et quand on veut sélectionner le premier paragraphe on se retrouve avec les spé techniques de l'album en bout de ligne.
Bref.
Plutôt que de me faire iech j'ai fait une copie d'écran et j'ai demandé un OCR à ChatGPT. Généralement ca marche impeccable, ca prend 5s et je m'étais mème étonné ici des quelques rajoutis occasionnellement bien venus dans la mise en forme.
Mais là, ça ne s'est pas passé comme prévu.
Il m'a sorti un texte qui était une paraphrase du texte soumis.
Je lui ai demandé plusieurs fois, en restreignant le champs de l'image, en lui donnant l'amorce du texte, en spécifiant "mot à mot", pas moyen, il me sortait toujours le même texte à la louche, le même sens mais pas les même mots. Ah, détail important, c'était pour la fiche de Kernok le pirate, chez Oxymore. Au bout d'un moment j'ai réussi à lui faire faire ce que je voulais en lui expliquant que l'album avait changé d'éditeur et qu'il me ressortait sans doute le texte de la vieille présentation de chez Soleil et que je voulais celle de l'image que je lui proposais.
En poussant l'investigation il a admis qu'il s'était basé sur un texte de chez Soleil, mais qu'il n'en trouvait plus la source.
Pour plus de détail il me recommandait le très bon site bédéthèque . com.
