repompage du site et IA gloubiboulga

Poser des questions, proposer des évolutions, étendre les zones, organisations diverses du site, partenaires...
Avatar du membre
sly
Messages : 5051
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

repompage du site et IA gloubiboulga

Message par sly »

Hello,

Pour je ne sais quelle raison je ne travaillais plus, et je flânais sur les anciens sujets du forum où l'on découvrait des sites qui recopiaient le contenu de refuges.info sans le citer ni rappelez d'où vient l'info : viewtopic.php?p=40301
Notre ours, de ses subtiles pattes, les avaient alors remis dans le droit chemin.

Puis dominique avait imaginé un futur possible où les outils d'intelligence dites "artificielles" génératives pourraient repomper ça, mouliner, plagier et, in finé rendre difficile notre capacité à trouver qui plagit le site, et, évidement, ne cite absolument pas ses sources comme l'exige la licence.

Quel visionnaire, voilà ce que je trouve : refuge.camp une application pour smartphone "Votre guide complet des refuges montagnards !" (je n'ose plus mettre de lien, je vais me faire virer pour spam)

Je fouille https://refuge.camp/fr/explore et je trouve des pépites :

https://refuge.camp/fr/refuge/ancien-ch ... s-mouilles
Ancien Chalet des Mouilles 1406 M
L'ancien Refuge du Goûter : Histoire d'un Joyau Disparu
L'ancien Refuge du Goûter, situé dans le majestueux massif du Mont-Blanc, a été détruit par un incendie en 2009. Seule la fontaine reste encore debout, témoignant du passé glorieux de cet endroit.
https://www.refuges.info/point/2316/cab ... de-Bizard/
Chalet de Bizard 1889 M
Refuge de Trébutine : Un Abri Authentique en Montagne

Le Refuge de Trébutine est une imposante structure devant laquelle se trouve un conteneur sécurisé. Une porte latérale du côté Ouest, protégée par des tôles, affiche le mot "Bienvenue... Vous avez dit Bizard...?". Les fenêtres sont neuves et verrouillées. Bien que l'IGN 1:25000 Beaufortain le répertorie avec un pictogramme d'abri ouvert, il semble réservé aux alpinistes.
On peut vaguement y reconnaître l'inspiration de Claude, encore qu'il faille reprendre la fiche d'origine pour se convaincre qu'il y va d'une sorte de "plagiat" que je décrirais plutôt comme cadavre exquis, que la machine a transformé à sa sauce pour en dire des trucs vaguement faux ou crédibles, c'est selon.

Des pelles comme ça, y'en a à la perle, qu'est-ce qu'on va rire...

J'espère quand même que les randonneurs qui achètent ce genre d'application pour $25 n'ont pas la naïveté trop développée, il va y avoir des déconvenues...
Avatar du membre
Pascal 74
Messages : 878
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

Je suis allé voir sur le site.
Difficile à dire s'il y a pompage de données. Il faudrait que ceux ou celles qui ont beaucoup contribué aux fiches reconnaissent leurs propos dans les descriptions (Claude, par exemple). Maintenant, on ne va pas se raconter d'histoire : Quand les concepteurs se vantent d'un répertoire de 16000 références depuis 2022, ce n'est pas venu tout seul.
Sur quelques fiches de refuges que j'ai faite : Le nom de la fiche est parfois fausse dans le descriptif (confusion). Le descriptif lui-même se résume à une présentation commerciale teintée de conseil écolo-reponsables, avec peu ou pas de renseignement pratique autre que "allez sur leur site internet" pour les refuges gardés.
Le site est truffé de bugs, dus probablement à un moulinage des données pas si performant que son concepteur le revendique : confusion sur le nom du refuge (déjà dit), refuge "non gardé" mais "gardienné toute l'année", anglicisme inutile sur le picto indiquant l'état d'ouverture, information erronée sur cet état d'ouverture (Plattières, par ex.), n'en jetez plus !
Si on ajoute, Politique tarifaire pas claire pour l'appli : "Achats via l'application (Vendeurs variables) 24,99 € - 99,99 € si facturé via Play", autorisation de l'application demandant la facturation via Google Play.

En conclusion, c'est une pompe à fric parfaitement inutile avec des renseignements que l'on peut facilement se procurer de par ailleurs et pour beaucoup moins cher. Malheureusement, ce type de start-up se répand comme de la poudre (aux yeux). À fuir !
Pour une montagne libre.
Avatar du membre
Claude Mauguier
Messages : 4235
Enregistré le : 16 févr. 2005, 01:00
Localisation : Isére

Re: repompage du site et IA gloubiboulga

Message par Claude Mauguier »

Pascal 74 a écrit : 28 nov. 2024, 19:21 Je suis allé voir sur le site.
Difficile à dire s'il y a pompage de données. Il faudrait que ceux ou celles qui ont beaucoup contribué aux fiches reconnaissent leurs propos dans les descriptions (Claude, par exemple). Maintenant, on ne va pas se raconter d'histoire : Quand les concepteurs se vantent d'un répertoire de 16000 références depuis 2022, ce n'est pas venu tout seul.
Sur quelques fiches de refuges que j'ai faite : Le nom de la fiche est parfois fausse dans le descriptif (confusion). Le descriptif lui-même se résume à une présentation commerciale teintée de conseil écolo-reponsables, avec peu ou pas de renseignement pratique autre que "allez sur leur site internet" pour les refuges gardés.
Le site est truffé de bugs, dus probablement à un moulinage des données pas si performant que son concepteur le revendique : confusion sur le nom du refuge (déjà dit), refuge "non gardé" mais "gardienné toute l'année", anglicisme inutile sur le picto indiquant l'état d'ouverture, information erronée sur cet état d'ouverture (Plattières, par ex.), n'en jetez plus !
Si on ajoute, Politique tarifaire pas claire pour l'appli : "Achats via l'application (Vendeurs variables) 24,99 € - 99,99 € si facturé via Play", autorisation de l'application demandant la facturation via Google Play.



En conclusion, c'est une pompe à fric parfaitement inutile avec des renseignements que l'on peut facilement se procurer de par ailleurs et pour beaucoup moins cher. Malheureusement, ce type de start-up se répand comme de la poudre (aux yeux). À fuir !
Pour résumer, ces sites sont des attrape-nigauds complètement ignorants de l'univers "montagne" et qui cliquent "pour voir" ou avoir des idées pour leurs prochaines vacances. Ils finiront pas s'apercevoir qu'on se paie leur tête, mais ce sera trop tard...ils auront payé !

Pour le moment sly et toi estimez que le risque se résume au pompage de contenu...ce qui se fait déjà via les bots.
Néanmoins, il existe bien une porte ouverte (ou forcée) sur la structure WRI. Et par une porte on peut entrer et bidouiller, extraire, transformer éventuellement la structure et les données du site. Détrompez-moi. Et dites-nous si le fait de fermer la porte apporte plus de dommages que d'avantages. :?: :ours:
Avatar du membre
sly
Messages : 5051
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Claude Mauguier a écrit : 29 nov. 2024, 08:48 Pour le moment sly et toi estimez que le risque se résume au pompage de contenu...ce qui se fait déjà via les bots.
Exact. Mais je n'arrive pas encore à bien en mesurer les conséquences. De prim abord, cela me semble très limité pour refuges.info, un peu de parasitisme, quelques rares contributeurs qui iront partager leurs photos chez eux plutôt qu'ici. Les dommages me semblent avant tout concerner l'utilisateur qui aura perdu son argent pour un contenu médiocre. Pas grave, le darwinisme économique lui apprendra à reconnaître la médiocrité.

Non, les dommages, je les vois plus pour les cabanes :
Il me semble que depuis le début ou presque, refuges.info fait l'effort de sensibiliser à la protection de ces biens communs, les réservations sont zigouillées, les incitations au "squat" prolongé nettoyées. L'équipe de modération surveille ces dérapages.

Dans les applications type refuges.camp, on assiste à la marchandisation de la cabane, la terminologie est la même que pour acheter le nouvel Iphone ou tout autre gadget à la mode :
Découvrez les nouveautés et tendances des refuges de montagne
D'ailleurs, ça semble sur le même ton que tout le reste, c'est peut-être bien généré par une IA...

Claude Mauguier a écrit : 29 nov. 2024, 08:48 Néanmoins, il existe bien une porte ouverte (ou forcée) sur la structure WRI. Et par une porte on peut entrer et bidouiller, extraire, transformer éventuellement la structure et les données du site. Détrompez-moi. Et dites-nous si le fait de fermer la porte apporte plus de dommages que d'avantages. :?: :ours:
Je ne vois aucune raison de s'inquiéter de ce coté là, ce n'est pas comme ça que fonctionne un site internet.
Un site internet possède 2 portes :
- La grande porte d'entrée jolie et bien en vue qui donne accès en lecture uniquement au contenu du site (on y trouve toutefois une sorte de livre d'or, le forum et les commentaires) que l'on peut compléter strictement dans le cadre prévu par les développeurs.
- La petite porte par derrière, pas facile à trouver faite d'acier et de digicode et sur laquelle seuls les admins peuvent rentrer, c'est là que l'on peut "bidouiller" la structure et la disposition de tout ce qui est visible du public.

Dans l'éventualité ou la petite porte était forcée et cassée par un "pirate", ça n'est même pas si grave car l'informatique permet de la magie : il existe non loin dans un endroit secret une copie complète de tout l'édifice, avec les derniers commentaires et dernières fiches : des sauvegardes.
Avatar du membre
leosw
Messages : 540
Enregistré le : 28 févr. 2013, 17:28
Localisation : Montagne noire

Re: repompage du site et IA gloubiboulga

Message par leosw »

Salut tout le monde,

Ouais en effet, cette fiche m'a fait bien rire : https://refuge.camp/fr/refuge/refuge-du-ventajou
Les données du texte sont de moi, mais reformulé avec des photos lunaires !

Le risque avec toutes ces réutilisations de données, ce serait qu'ils ouvrent un champ commentaire ou permettent la modification sans en informer la source d'origine : refuges.info
Dans ce cas on se retrouverait avec une base de donnée modifiée en tout sens et l'effort collaboratif serait pas bien exploité.

Un bon exemple c'est openstreetmap, où chaque "réutilisateur" s'efforce d'intégrer à la base originelle toutes les modifications apportées par ses membres.
Je contacterais les pompeurs que s'ils permettent ces modifications sans qu'elles nous soient remontées.

A tout'
Avatar du membre
sly
Messages : 5051
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Et pour Pascal qui douterait du repompage, voici une fiche que j'ai renseignée :
https://www.refuges.info/point/5908/cab ... es-Vignes/
et sa copie :
https://refuge.camp/fr/refuge/abri-des-vignes

Mon texte :
Accès: Depuis le bout du monde, monté direction saint jean d'arvey, puis quelque part sur le sentier des vignes
Remarques : Toute petit abri en cas d'orage, pas de quoi dormir, tout juste de quoi tenir debout en attendant que ça passe.

Nom inventé car rien d'indiqué nulle part.

Note 03/08/2017 : suite à problème technique je n'ai pas réussi à reprendre les coordonnées GPS précise, ni l'altitude, charge au prochain qui y passer d'améliorer le référencement
le texte repompé :
Ce petit abri temporaire, situé sur le sentier des vignes en direction de Saint-Jean d'Arvey, offre une protection contre les intempéries, mais ne permet pas de passer la nuit. Son emplacement exact et ses coordonnées GPS ne sont pas indiqués, nécessitant une amélioration du référencement par les prochains visiteurs.
📅 Informations Pratiques

Type : Abri temporaire
Capacité : Pour se tenir debout en cas d'orage
Disponibilité : Ouvert toute l'année
Réservation : Non disponible

Note: Suite à un problème technique le 03/08/2017, les coordonnées GPS précises de cet abri n'ont pas pu être récupérées.
Je crois que cela ne fait aucune doute.

On notera avec amusement comment le logiciel a sous estimé le sens de "le bout du monde", il a dû prendre ça pour une blague et l'a zapé, mais hélas pour lui, j'avais oublié les majuscules. "Le Bout du Monde" n'est pas une image ou une expression, il s'agit d'un hammeau bien réél duquel démarre la randonnée, et donc, "en direction de St Jean d'Arvey" n'a plus de sens si on ne précise pas d'où on part.
Avatar du membre
Pascal 74
Messages : 878
Enregistré le : 17 juin 2007, 16:37
Localisation : Annecy

Re: repompage du site et IA gloubiboulga

Message par Pascal 74 »

sly a écrit : 29 nov. 2024, 10:00 ... les dommages, je les vois plus pour les cabanes :
Il me semble que depuis le début ou presque, refuges.info fait l'effort de sensibiliser à la protection de ces biens communs, les réservations sont zigouillées, les incitations au "squat" prolongé nettoyées. L'équipe de modération surveille ces dérapages.

Dans les applications type refuges.camp, on assiste à la marchandisation de la cabane, la terminologie est la même que pour acheter le nouvel Iphone ou tout autre gadget à la mode :
Découvrez les nouveautés et tendances des refuges de montagne
D'ailleurs, ça semble sur le même ton que tout le reste, c'est peut-être bien généré par une IA...
+1
sly a écrit : 29 nov. 2024, 10:49 Et pour Pascal qui douterait du repompage, voici une fiche que j'ai renseignée :
https://www.refuges.info/point/5908/cab ... es-Vignes/
et sa copie :
https://refuge.camp/fr/refuge/abri-des-vignes
...
Je crois que cela ne fait aucune doute...
+1 encore

J'avais pensé dans un premier temps à la piste justice pour non respect des conditions de la licence. Même si l'argument de sly cité plus haut m'a convaincu, il n'y a aucune certitude sur ce que serait l'avis d'un juge en l'état. Le mieux, si sly veut tâter de ce terrain là, serait d'abord d'avoir une certain nombre (conséquent) de similitudes troublantes et ensuite d'aller avec ce dossier voir un avocat si possible spécialisée dans les échanges numériques et internet pour avis. Je n'y suis pas favorable pour des raisons de coût de procédure alors même que sly paie déjà de sa personne et de son temps pour maintenir le site.

Ce qu'on peut faire à moindre frais, c'est mettre pour quelques temps une phrase d'avertissement en première page du site en couleur qui ressort. Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons totalement ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Pour une montagne libre.
Avatar du membre
Claude Mauguier
Messages : 4235
Enregistré le : 16 févr. 2005, 01:00
Localisation : Isére

Re: repompage du site et IA gloubiboulga

Message par Claude Mauguier »

Pascal 74 a écrit : 29 nov. 2024, 16:37 .........................................;
J'avais pensé dans un premier temps à la piste justice pour non respect des conditions de la licence. Même si l'argument de sly cité plus haut m'a convaincu, il n'y a aucune certitude sur ce que serait l'avis d'un juge en l'état. Le mieux, si sly veut tâter de ce terrain là, serait d'abord d'avoir une certain nombre (conséquent) de similitudes troublantes et ensuite d'aller avec ce dossier voir un avocat si possible spécialisée dans les échanges numériques et internet pour avis. Je n'y suis pas favorable pour des raisons de coût de procédure alors même que sly paie déjà de sa personne et de son temps pour maintenir le site.

Ce qu'on peut faire à moindre frais, c'est mettre pour quelques temps une phrase d'avertissement en première page du site en couleur qui ressort. Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Je suis d'accord avec ta proposition. Ce peut être dissuasif tant que seuls des humains seraient impliqués (IA)
Avatar du membre
sly
Messages : 5051
Enregistré le : 29 févr. 2004, 17:59
Localisation : Chambéry - Savoie

Re: repompage du site et IA gloubiboulga

Message par sly »

Pascal 74 a écrit : 29 nov. 2024, 16:37 Ce pourrait -être :

AVERTISSEMENT : Nous avons été informé que des sites peu scrupuleux dont la vocation est de revendre ces données via des applications pour mobiles utilisaient nos données en dehors du cadre fixé par la licence du site.
Nous désapprouvons totalement ces procédés pour lesquels il n'existe aucun accord de partenariat. Refuges.info reste un site libre et gratuit d'accès. Nous ne proposerons jamais de monnayer le travail apporté par nos contributeurs et qui nous font confiance.


Qu'en pensez-vous ?
Je n'en vois pas suffisamment d'intérêts et j'y vois des inconvénients.

La grande majorité de nos utilisateurs ignorent que refuge.camp existe, ils ne vont rien comprendre à une phrase trop vague ("des sites") et ne pourrons en ressortir qu'un sentiment de chasse au plagiat de la part d'un site "libre", il faudrait donner du contexte, donner un cas précis sinon l'internaute visiteur ne peut se forger une idée pour et contre.
De plus, ni comprenant rien, ça ne fera qu'une alerte de plus en rouge, puis en rose et qu'a la fin, plus personne ne lit rien. Ne grillons pas de joker crédibilité sur nos alertes.

A la limite sur la page de la licence qui n'intéresse que les repompeurs ou ceux au faits de ce genre d'agissements.

Si vraiment il y avait quelque chose à faire, je ne trouve pas ça assez utile, la case justice est bien trop coûteuse et nous ferait passer pour les méchants. Il y aurait donc de mon point de vue, "à la recherche de bonne foi" un contact avec le gestionnaire de l'appli pour lui demander de respecter la licence.

Voir d'ailleurs sur openstreetmap leur suggestions pour gérer ce genre de cas :
https://wiki.openstreetmap.org/wiki/Lac ... ttribution