repompage du site et IA gloubiboulga

Poser des questions, proposer des évolutions, étendre les zones, organisations diverses du site, partenaires...
Avatar du membre
sly
Messages : 5052
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

repompage du site et IA gloubiboulga

Message par sly »

Hello,

Pour je ne sais quelle raison je ne travaillais plus, et je flânais sur les anciens sujets du forum où l'on découvrait des sites qui recopiaient le contenu de refuges.info sans le citer ni rappelez d'où vient l'info : viewtopic.php?p=40301
Notre ours, de ses subtiles pattes, les avaient alors remis dans le droit chemin.

Puis dominique avait imaginé un futur possible où les outils d'intelligence dites "artificielles" génératives pourraient repomper ça, mouliner, plagier et, in finé rendre difficile notre capacité à trouver qui plagit le site, et, évidement, ne cite absolument pas ses sources comme l'exige la licence.

Quel visionnaire, voilà ce que je trouve : refuge.camp une application pour smartphone "Votre guide complet des refuges montagnards !" (je n'ose plus mettre de lien, je vais me faire virer pour spam)

Je fouille https://refuge.camp/fr/explore et je trouve des pépites :

https://refuge.camp/fr/refuge/ancien-ch ... s-mouilles
Ancien Chalet des Mouilles 1406 M
L'ancien Refuge du Goûter : Histoire d'un Joyau Disparu
L'ancien Refuge du Goûter, situé dans le majestueux massif du Mont-Blanc, a été détruit par un incendie en 2009. Seule la fontaine reste encore debout, témoignant du passé glorieux de cet endroit.
https://www.refuges.info/point/2316/cab ... de-Bizard/
Chalet de Bizard 1889 M
Refuge de Trébutine : Un Abri Authentique en Montagne

Le Refuge de Trébutine est une imposante structure devant laquelle se trouve un conteneur sécurisé. Une porte latérale du côté Ouest, protégée par des tôles, affiche le mot "Bienvenue... Vous avez dit Bizard...?". Les fenêtres sont neuves et verrouillées. Bien que l'IGN 1:25000 Beaufortain le répertorie avec un pictogramme d'abri ouvert, il semble réservé aux alpinistes.
On peut vaguement y reconnaître l'inspiration de Claude, encore qu'il faille reprendre la fiche d'origine pour se convaincre qu'il y va d'une sorte de "plagiat" que je décrirais plutôt comme cadavre exquis, que la machine a transformé à sa sauce pour en dire des trucs vaguement faux ou crédibles, c'est selon.

Des pelles comme ça, y'en a à la perle, qu'est-ce qu'on va rire...

J'espère quand même que les randonneurs qui achètent ce genre d'application pour $25 n'ont pas la naïveté trop développée, il va y avoir des déconvenues...
Avatar du membre
Pascal 74
Messages : 881
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

Je suis allé voir sur le site.
Difficile à dire s'il y a pompage de données. Il faudrait que ceux ou celles qui ont beaucoup contribué aux fiches reconnaissent leurs propos dans les descriptions (Claude, par exemple). Maintenant, on ne va pas se raconter d'histoire : Quand les concepteurs se vantent d'un répertoire de 16000 références depuis 2022, ce n'est pas venu tout seul.
Sur quelques fiches de refuges que j'ai faite : Le nom de la fiche est parfois fausse dans le descriptif (confusion). Le descriptif lui-même se résume à une présentation commerciale teintée de conseil écolo-reponsables, avec peu ou pas de renseignement pratique autre que "allez sur leur site internet" pour les refuges gardés.
Le site est truffé de bugs, dus probablement à un moulinage des données pas si performant que son concepteur le revendique : confusion sur le nom du refuge (déjà dit), refuge "non gardé" mais "gardienné toute l'année", anglicisme inutile sur le picto indiquant l'état d'ouverture, information erronée sur cet état d'ouverture (Plattières, par ex.), n'en jetez plus !
Si on ajoute, Politique tarifaire pas claire pour l'appli : "Achats via l'application (Vendeurs variables) 24,99 € - 99,99 € si facturé via Play", autorisation de l'application demandant la facturation via Google Play.

En conclusion, c'est une pompe à fric parfaitement inutile avec des renseignements que l'on peut facilement se procurer de par ailleurs et pour beaucoup moins cher. Malheureusement, ce type de start-up se répand comme de la poudre (aux yeux). À fuir !
Pour une montagne libre.
Avatar du membre
Claude Mauguier
Messages : 4236
Enregistré le : 16 févr. 2005, 01:00
Localisation : Isére

Re: repompage du site et IA gloubiboulga

Message par Claude Mauguier »

Pascal 74 a écrit : 28 nov. 2024, 19:21 Je suis allé voir sur le site.
Difficile à dire s'il y a pompage de données. Il faudrait que ceux ou celles qui ont beaucoup contribué aux fiches reconnaissent leurs propos dans les descriptions (Claude, par exemple). Maintenant, on ne va pas se raconter d'histoire : Quand les concepteurs se vantent d'un répertoire de 16000 références depuis 2022, ce n'est pas venu tout seul.
Sur quelques fiches de refuges que j'ai faite : Le nom de la fiche est parfois fausse dans le descriptif (confusion). Le descriptif lui-même se résume à une présentation commerciale teintée de conseil écolo-reponsables, avec peu ou pas de renseignement pratique autre que "allez sur leur site internet" pour les refuges gardés.
Le site est truffé de bugs, dus probablement à un moulinage des données pas si performant que son concepteur le revendique : confusion sur le nom du refuge (déjà dit), refuge "non gardé" mais "gardienné toute l'année", anglicisme inutile sur le picto indiquant l'état d'ouverture, information erronée sur cet état d'ouverture (Plattières, par ex.), n'en jetez plus !
Si on ajoute, Politique tarifaire pas claire pour l'appli : "Achats via l'application (Vendeurs variables) 24,99 € - 99,99 € si facturé via Play", autorisation de l'application demandant la facturation via Google Play.



En conclusion, c'est une pompe à fric parfaitement inutile avec des renseignements que l'on peut facilement se procurer de par ailleurs et pour beaucoup moins cher. Malheureusement, ce type de start-up se répand comme de la poudre (aux yeux). À fuir !
Pour résumer, ces sites sont des attrape-nigauds complètement ignorants de l'univers "montagne" et qui cliquent "pour voir" ou avoir des idées pour leurs prochaines vacances. Ils finiront pas s'apercevoir qu'on se paie leur tête, mais ce sera trop tard...ils auront payé !

Pour le moment sly et toi estimez que le risque se résume au pompage de contenu...ce qui se fait déjà via les bots.
Néanmoins, il existe bien une porte ouverte (ou forcée) sur la structure WRI. Et par une porte on peut entrer et bidouiller, extraire, transformer éventuellement la structure et les données du site. Détrompez-moi. Et dites-nous si le fait de fermer la porte apporte plus de dommages que d'avantages. :?: :ours:
Avatar du membre
sly
Messages : 5052
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Claude Mauguier a écrit : 29 nov. 2024, 08:48 Pour le moment sly et toi estimez que le risque se résume au pompage de contenu...ce qui se fait déjà via les bots.
Exact. Mais je n'arrive pas encore à bien en mesurer les conséquences. De prim abord, cela me semble très limité pour refuges.info, un peu de parasitisme, quelques rares contributeurs qui iront partager leurs photos chez eux plutôt qu'ici. Les dommages me semblent avant tout concerner l'utilisateur qui aura perdu son argent pour un contenu médiocre. Pas grave, le darwinisme économique lui apprendra à reconnaître la médiocrité.

Non, les dommages, je les vois plus pour les cabanes :
Il me semble que depuis le début ou presque, refuges.info fait l'effort de sensibiliser à la protection de ces biens communs, les réservations sont zigouillées, les incitations au "squat" prolongé nettoyées. L'équipe de modération surveille ces dérapages.

Dans les applications type refuges.camp, on assiste à la marchandisation de la cabane, la terminologie est la même que pour acheter le nouvel Iphone ou tout autre gadget à la mode :
Découvrez les nouveautés et tendances des refuges de montagne
D'ailleurs, ça semble sur le même ton que tout le reste, c'est peut-être bien généré par une IA...

Claude Mauguier a écrit : 29 nov. 2024, 08:48 Néanmoins, il existe bien une porte ouverte (ou forcée) sur la structure WRI. Et par une porte on peut entrer et bidouiller, extraire, transformer éventuellement la structure et les données du site. Détrompez-moi. Et dites-nous si le fait de fermer la porte apporte plus de dommages que d'avantages. :?: :ours:
Je ne vois aucune raison de s'inquiéter de ce coté là, ce n'est pas comme ça que fonctionne un site internet.
Un site internet possède 2 portes :
- La grande porte d'entrée jolie et bien en vue qui donne accès en lecture uniquement au contenu du site (on y trouve toutefois une sorte de livre d'or, le forum et les commentaires) que l'on peut compléter strictement dans le cadre prévu par les développeurs.
- La petite porte par derrière, pas facile à trouver faite d'acier et de digicode et sur laquelle seuls les admins peuvent rentrer, c'est là que l'on peut "bidouiller" la structure et la disposition de tout ce qui est visible du public.

Dans l'éventualité ou la petite porte était forcée et cassée par un "pirate", ça n'est même pas si grave car l'informatique permet de la magie : il existe non loin dans un endroit secret une copie complète de tout l'édifice, avec les derniers commentaires et dernières fiches : des sauvegardes.
Avatar du membre
leosw
Messages : 542
Enregistré le : 28 févr. 2013, 17:28
Localisation : Montagne noire

Re: repompage du site et IA gloubiboulga

Message par leosw »

Salut tout le monde,

Ouais en effet, cette fiche m'a fait bien rire : https://refuge.camp/fr/refuge/refuge-du-ventajou
Les données du texte sont de moi, mais reformulé avec des photos lunaires !

Le risque avec toutes ces réutilisations de données, ce serait qu'ils ouvrent un champ commentaire ou permettent la modification sans en informer la source d'origine : refuges.info
Dans ce cas on se retrouverait avec une base de donnée modifiée en tout sens et l'effort collaboratif serait pas bien exploité.

Un bon exemple c'est openstreetmap, où chaque "réutilisateur" s'efforce d'intégrer à la base originelle toutes les modifications apportées par ses membres.
Je contacterais les pompeurs que s'ils permettent ces modifications sans qu'elles nous soient remontées.

A tout'
Avatar du membre
sly
Messages : 5052
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Et pour Pascal qui douterait du repompage, voici une fiche que j'ai renseignée :
https://www.refuges.info/point/5908/cab ... es-Vignes/
et sa copie :
https://refuge.camp/fr/refuge/abri-des-vignes

Mon texte :
Accès: Depuis le bout du monde, monté direction saint jean d'arvey, puis quelque part sur le sentier des vignes
Remarques : Toute petit abri en cas d'orage, pas de quoi dormir, tout juste de quoi tenir debout en attendant que ça passe.

Nom inventé car rien d'indiqué nulle part.

Note 03/08/2017 : suite à problème technique je n'ai pas réussi à reprendre les coordonnées GPS précise, ni l'altitude, charge au prochain qui y passer d'améliorer le référencement
le texte repompé :
Ce petit abri temporaire, situé sur le sentier des vignes en direction de Saint-Jean d'Arvey, offre une protection contre les intempéries, mais ne permet pas de passer la nuit. Son emplacement exact et ses coordonnées GPS ne sont pas indiqués, nécessitant une amélioration du référencement par les prochains visiteurs.
📅 Informations Pratiques

Type : Abri temporaire
Capacité : Pour se tenir debout en cas d'orage
Disponibilité : Ouvert toute l'année
Réservation : Non disponible

Note: Suite à un problème technique le 03/08/2017, les coordonnées GPS précises de cet abri n'ont pas pu être récupérées.
Je crois que cela ne fait aucune doute.

On notera avec amusement comment le logiciel a sous estimé le sens de "le bout du monde", il a dû prendre ça pour une blague et l'a zapé, mais hélas pour lui, j'avais oublié les majuscules. "Le Bout du Monde" n'est pas une image ou une expression, il s'agit d'un hammeau bien réél duquel démarre la randonnée, et donc, "en direction de St Jean d'Arvey" n'a plus de sens si on ne précise pas d'où on part.
Avatar du membre
Pascal 74
Messages : 881
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

sly a écrit : 29 nov. 2024, 10:00 ... les dommages, je les vois plus pour les cabanes :
Il me semble que depuis le début ou presque, refuges.info fait l'effort de sensibiliser à la protection de ces biens communs, les réservations sont zigouillées, les incitations au "squat" prolongé nettoyées. L'équipe de modération surveille ces dérapages.

Dans les applications type refuges.camp, on assiste à la marchandisation de la cabane, la terminologie est la même que pour acheter le nouvel Iphone ou tout autre gadget à la mode :
Découvrez les nouveautés et tendances des refuges de montagne
D'ailleurs, ça semble sur le même ton que tout le reste, c'est peut-être bien généré par une IA...
+1
sly a écrit : 29 nov. 2024, 10:49 Et pour Pascal qui douterait du repompage, voici une fiche que j'ai renseignée :
https://www.refuges.info/point/5908/cab ... es-Vignes/
et sa copie :
https://refuge.camp/fr/refuge/abri-des-vignes
...
Je crois que cela ne fait aucune doute...
+1 encore

J'avais pensé dans un premier temps à la piste justice pour non respect des conditions de la licence. Même si l'argument de sly cité plus haut m'a convaincu, il n'y a aucune certitude sur ce que serait l'avis d'un juge en l'état. Le mieux, si sly veut tâter de ce terrain là, serait d'abord d'avoir une certain nombre (conséquent) de similitudes troublantes et ensuite d'aller avec ce dossier voir un avocat si possible spécialisée dans les échanges numériques et internet pour avis. Je n'y suis pas favorable pour des raisons de coût de procédure alors même que sly paie déjà de sa personne et de son temps pour maintenir le site.

Ce qu'on peut faire à moindre frais, c'est mettre pour quelques temps une phrase d'avertissement en première page du site en couleur qui ressort. Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons totalement ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Pour une montagne libre.
Avatar du membre
Claude Mauguier
Messages : 4236
Enregistré le : 16 févr. 2005, 01:00
Localisation : Isére

Re: repompage du site et IA gloubiboulga

Message par Claude Mauguier »

Pascal 74 a écrit : 29 nov. 2024, 16:37 .........................................;
J'avais pensé dans un premier temps à la piste justice pour non respect des conditions de la licence. Même si l'argument de sly cité plus haut m'a convaincu, il n'y a aucune certitude sur ce que serait l'avis d'un juge en l'état. Le mieux, si sly veut tâter de ce terrain là, serait d'abord d'avoir une certain nombre (conséquent) de similitudes troublantes et ensuite d'aller avec ce dossier voir un avocat si possible spécialisée dans les échanges numériques et internet pour avis. Je n'y suis pas favorable pour des raisons de coût de procédure alors même que sly paie déjà de sa personne et de son temps pour maintenir le site.

Ce qu'on peut faire à moindre frais, c'est mettre pour quelques temps une phrase d'avertissement en première page du site en couleur qui ressort. Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Je suis d'accord avec ta proposition. Ce peut être dissuasif tant que seuls des humains seraient impliqués (IA)
Avatar du membre
sly
Messages : 5052
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Pascal 74 a écrit : 29 nov. 2024, 16:37 Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons totalement ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Je n'en vois pas suffisamment d'intérêts et j'y vois des inconvénients.

La grande majorité de nos utilisateurs ignorent que refuge.camp existe, ils ne vont rien comprendre à une phrase trop vague ("des sites") et ne pourrons en ressortir qu'un sentiment de chasse au plagiat de la part d'un site "libre", il faudrait donner du contexte, donner un cas précis sinon l'internaute visiteur ne peut se forger une idée pour et contre.
De plus, n'y comprenant rien, ça ne fera qu'une alerte de plus en rouge, puis en rose et qu'a la fin, plus personne ne lit rien. Ne grillons pas de joker crédibilité sur nos alertes.

A la limite sur la page de la licence qui n'intéresse que les repompeurs ou ceux au faits de ce genre d'agissements.

Si vraiment il y avait quelque chose à faire, je ne trouve pas ça assez utile, la case justice est bien trop coûteuse et nous ferait passer pour les méchants. Il y aurait donc de mon point de vue, "à la recherche de bonne foi" un contact avec le gestionnaire de l'appli pour lui demander de respecter la licence.

Voir d'ailleurs sur openstreetmap leur suggestions pour gérer ce genre de cas :
https://wiki.openstreetmap.org/wiki/Lac ... ttribution
Avatar du membre
leosw
Messages : 542
Enregistré le : 28 févr. 2013, 17:28
Localisation : Montagne noire

Re: repompage du site et IA gloubiboulga

Message par leosw »

Je suis du même avis, leur annoncer qu'on a pu constater une mauvaise utilisation de la licence et de leur demander de se mettre en accord avec celle-ci.
C'est un peu une mise en demeure d'amateur
Avatar du membre
Pascal 74
Messages : 881
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

Je suis tombé sur un anti-exemple de plagiat : https://refuge.camp/fr/refuge/cabane-a-gerbier
:lol:
Si après ça il y a encore un doute sur le fait que ce soit mouliné par un aspirateur dopé à l'IA qui bogue encore pas mal ! Aucun être humain n'aurait fait une erreur aussi grossière.
Tiens, on pourrait également lui transmettre les messages de tous les dév. qui nous proposent de monnayer leurs services pour ergonomiser le site parce-que le sien, pardon (bandeau du bas qui ne se replie pas et masque le bas de la page), il fait vraiment amateur.

PS : Je garde sous le coude le principe de la phrase en page d'accueil qui peut très bien être l'étape d'après si les négociations échouent. Ce topic est visible et il est facile d'en savoir plus avant qu'une chasse au plagiat s'organise, puisque nous l'avons nous même initié pour le site.
Pour une montagne libre.
Avatar du membre
sly
Messages : 5052
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Pascal 74 a écrit : 29 nov. 2024, 18:19 Je suis tombé sur un anti-exemple de plagiat : https://refuge.camp/fr/refuge/cabane-a-gerbier
Punaise, elle n'est pas mal celle là. Va comprendre quel autre contenu il a fusionné pour en arriver à ce délire.

J'en arrive à me demander s'il y a vraiment des gens qui s'en servent ou si c'est une vaste blague ?

Si j'en crois les commentaires de l'app sur le playstore, oui :
uu.png
Mais déjà que j'avais une piètre opinion des "avis vérifiés", là, ça ne s'arrange pas !
Dans quel monde on vit...
Vous n’avez pas les permissions nécessaires pour voir les fichiers joints à ce message.
Avatar du membre
Pascal 74
Messages : 881
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

44 "j'aime" indique le picto, à droite, t'as vu ? :roll:

edit : Tiens , c'est descendu à 11 :o

Ah, c'est à 24 maintenant :oops:
Pour une montagne libre.
Avatar du membre
leosw
Messages : 542
Enregistré le : 28 févr. 2013, 17:28
Localisation : Montagne noire

Re: repompage du site et IA gloubiboulga

Message par leosw »

Je me suis permis une prise de contact, qui va avoir pour objet de voir avec lui comment il pourrait respecter notre licence, le responsabiliser sur la quantité d'erreurs qu'il a intégré via ce remodelage, et lui demander si ils ne veut pas contribuer d'une manière ou d'un autre au projet plutôt que de partir sur un plagiat dégradé :-)
Avatar du membre
Pascal 74
Messages : 881
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

leosw a écrit : 29 nov. 2024, 18:52 Je me suis permis une prise de contact, qui va avoir pour objet de voir avec lui comment il pourrait respecter notre licence, le responsabiliser sur la quantité d'erreurs qu'il a intégré via ce remodelage, et lui demander si ils ne veut pas contribuer d'une manière ou d'un autre au projet plutôt que de partir sur un plagiat dégradé :-)
Bah, si tu veux. J'ai l'impression néanmoins qu'on n'est pas du même monde (d'internet) et je serai le premier surpris qu'il accède à ta demande de contribuer au site. Sly a raison :
sly a écrit : 29 nov. 2024, 18:41 ...Dans quel monde on vit...
Pour une montagne libre.