Zwischen Data Mining und KI: Wie TKM Ihnen hilft, Ihre F&E- und Innovationsinvestitionen zu optimieren 

Effektives Technologiemonitoring beruht in erster Linie auf dem gezielten und strukturierten Einsatz der richtigen Data-Mining-Tools, orientiert an den Geschäftsanforderungen und unterstützt durch menschliches Fachwissen im Bereich Monitoring

Zwischen Data Mining und KI: Wie TKM Ihnen hilft, Ihre F&E- und Innovationsinvestitionen zu optimieren 

Effektives Technologiemonitoring beruht in erster Linie auf dem gezielten und strukturierten Einsatz der richtigen Data-Mining-Tools, orientiert an den Geschäftsanforderungen und unterstützt durch menschliches Fachwissen im Bereich Monitoring

Data-Mining und Künstliche Intelligenz

Die Herausforderung der Technologieüberwachung liegt heute weniger in der Suche nach Informationen als vielmehr in der Sortierung und Organisation der verfügbaren Daten und Informationen.  

Patente, wissenschaftliche Veröffentlichungen, Forschungsprojekte, institutionelle Berichte, Webquellen und Branchenneuigkeiten sammeln sich an und verbreiten sich in einem Tempo, das die analytischen Fähigkeiten des Menschen bei weitem übersteigt. 

Illustration in der Kosmetik

Dans le domaine de la cosmétique, ce sont près de 2 000 nouveaux brevets qui sont publiés chaque mois à l’échelle mondiale, témoignant d’une innovation constante et d’une course intense à la nouveauté. 

De manière encore plus spectaculaire, l’intelligence artificielle connaît une explosion informationnelle : le sujet fait l’objet de plus de 50 000 articles scientifiques chaque mois.   

Cette surabondance d’informations, ou « infobésité », rend difficile la sélection, l’analyse et la hiérarchisation des contenus pertinents. Les équipe R&D et Innovation se retrouvent confrontés à un flux d’informations quasi ininterrompu. 

In diesem Kontext besteht die Herausforderung nicht mehr nur im Zugang zu Informationen, sondern auch in der Fähigkeit, diese zu sortieren, zu strukturieren und zu analysieren. Wie können Sie diese riesigen Mengen heterogener Daten nutzen, ohne Ihre Tage mit der manuellen Sortierung zu verbringen? Wie können Sie Informationsrauschen und blinde Flecken vermeiden? 

Anders als der Hype vermuten lässt, hat generative KI die traditionellen Ansätze der künstlichen Intelligenz nicht verdrängt und wird dies aus mindestens drei Gründen auch nicht tun:   

  1. Traditionelle Methoden liefern in klar definierten Kontexten und mit strukturierten Daten hervorragende Ergebnisse. Um eine vergleichbare Leistung zu erzielen, wären für generative KI entweder sehr große Modelle oder sehr aufwendiges Nachtraining erforderlich. 
  2. Die Ergebnisse generativer KI sind sehr schwer zu interpretieren, im Gegensatz zu klassischen Modellen, die eine echte Erklärbarkeit ermöglichen. 
  3. Klassische Modelle sind weniger anfällig für Schwankungen und ihre Ergebnisse sind zuverlässiger, im Gegensatz zu generativen KI-Modellen, deren Robustheit problematisch sein kann (zum Beispiel aufgrund von Halluzinationen). 


L’IA générative apporte donc bien des outils méthodologiques utiles et intéressants. Mais pour des raisons d’efficacité d’une part mais aussi du fait de son coût environnemental élevé (sujet sur lequel TKM se mobilise pleinement) cet apport et cette contribution interviennent bien en complément des approches traditionnelles et non pour les remplacer.
 

La solution développée par TKM repose sur une démarche rigoureuse, articulée autour d’un mix équilibré associant, d’une part, l’exploitation de l’IA lorsqu’elle est réellement utile et, d’autre part, le datamining appliqué à la littérature technologique.  

Es ist das Ergebnis von mehr als 20 Jahren anerkannter Expertise, verbunden mit einer echten Innovationskraft und der Fähigkeit, neue Technologien zu integrieren – nicht wegen ihrer Neuheit, sondern wegen ihrer Nützlichkeit. 

Durch den Einsatz strukturierter Suchstrategien, Expertensysteme und, falls erforderlich, ergänzt durch Bausteine ​​der künstlichen Intelligenz, wandelt die Überwachungs- und Analysesoftware von TKM große Mengen an Rohdaten in Informationen um, die von Forschungs- und Entwicklungsteams, Teams für gewerbliches Eigentum und Innovationsteams genutzt werden können. 

Die Grundlagen verstehen: Data Mining, die Basis der Technologieüberwachung 

 

Data-Mining, das Rückgrat der groß angelegten Informationsbeschaffung 

Seit 25 Jahren hat sich Data Mining als Grundlage für die groß angelegte Informationsbeschaffung etabliert, und das ist kein Zufall. 

Le datamining regroupe l’ensemble des techniques permettant d’explorer, de nettoyer et de structurer de grands volumes de données afin d’en extraire des informations utiles. Dans le cas de la veille il s’agit de tendances, regroupements thématiques, émergences ou signaux faibles. 

In unserer über 20-jährigen Praxis der Technologiebeobachtung zeigt sich immer wieder eine Beobachtung: Nur ein Bruchteil der gesammelten Informationen hat echten strategischen Wert. Erfahrungsgemäß sind lediglich 10 bis 15 % der gesammelten Dokumente tatsächlich relevant für die Analyse und Entscheidungsfindung. 

Le rôle du datamining est précisément de gérer cet écart entre abondance et utilité. Il permet de : 

  • Informationsrauschen reduzieren, ohne die Vollständigkeit zu beeinträchtigen, 
  • Duplikate entfernen, 
  • schwache Signale erkennen, 
  • Strukturieren und organisieren Sie die Daten nach relevanten Kriterien 
  • Erstellung eines nutzbaren Korpus für die Analyse (menschlich und computergestützt) 


Ohne diese Vorarbeit wird das Monitoring schnell unüberschaubar, unabhängig von der Leistungsfähigkeit der eingesetzten Tools. Roboter und andere Crawler überfordern Sie rasch mit einer Flut unübersichtlicher Informationen und lenken Ihre F&E-Teams von einer Aufgabe ab, die für ihren Beruf dennoch unerlässlich ist: stets über den aktuellen Stand der Technik, den Wettbewerb und die Handlungsfreiheit informiert zu sein! 
 

→ Lire aussi – Constituer un fonds documentaire : collecter les données utiles à sa veille technologique ou concurrentielle 

Expertensysteme: Geschäftsorientierte Intelligenz 

Die Informationsbedürfnisse, die Art der verarbeiteten Daten und der Zweck eines Forschungs- und Entwicklungsteams, einer IP-Abteilung oder auch eines auf Innovation und offene Innovation ausgerichteten Teams sind nicht gleich.  

Die für die einzelnen Bedürfnisse geeigneten Behandlungen sind nicht immer dieselben, und die Arbeitsabläufe unterscheiden sich mitunter stark. 

Die Strukturierung von Daten für ein Luftfahrtunternehmen hat wahrscheinlich keinen Bezug zu derjenigen, die für ein großes Pharmaunternehmen oder ein KMU im Bereich der Feinmechanik nützlich ist. 

A l’inverse des outils magiques et de « l’effet boîte noire » que déteste tout analyste qui se respecte, les systèmes experts constituent la première étape de mise en œuvre opérationnelle de la veille dans la plateforme TKM. Ils reposent sur des bases issues du Datamining, c’est-à-dire sur des règles explicites et paramétrables par chaque type d’utilisateurs et d’utilisatrices : requêtes booléennes, opérateurs de proximité, filtres métiers, thésaurus et critères de classification, nettoyage et normalisation, etc… 

Cette approche est particulièrement efficace lorsque les critères de pertinence sont clairement et facilement identifiables : technologies ciblées, types de documents, acteurs à surveiller, zones géographiques, domaines d’application. 

Expertensysteme ermöglichen dann niedrigere Kosten1 : 

  • einen Geschäftsbedarf in eine formalisierte Suchstrategie umwandeln, 
  • um die vollständige Kontrolle über die Überwachungsbereiche zu behalten, 
  • um die Sortierung, Klassifizierung und Verbreitung von Informationen zu automatisieren. 


Sie bieten einen hervorragenden Kompromiss zwischen Leistung, Transparenz und Kostenkontrolle und lassen sich gleichzeitig leicht an veränderte Bedürfnisse anpassen.
 

Wenn Data Mining an seine Grenzen stößt: Der gezielte Beitrag von Präzisions-KI 

Nicht alle Datenverarbeitungsvorgänge lassen sich allein durch explizite Regeln problemlos bewältigen. Sobald die Bestimmung dieser Regeln komplex wird, stößt das Data-Mining an seine Grenzen. 

Nehmen wir ein Beispiel! 

Ihr Unternehmen, Ihr Industriezweig oder Ihre eigene Strategie basiert auf der Einhaltung von Umweltkriterien bei der Entwicklung und Herstellung Ihrer Produkte.  

Es ist daher legitim, dass Ihr Monitoring Innovationen, Produkte oder Patente Dritter (z. B. von Wettbewerbern oder Startups), die unter diese „umweltfreundlichen“ Kriterien fallen, prioritär hervorhebt und Ihren F&E-Teams zur Kenntnis bringt. 

Doch wie definiert man all diese Kriterien auf absolut erschöpfende Weise und übersetzt sie in ein Regelsystem innerhalb des eigenen Überwachungstools? Das dürfte kompliziert oder sogar völlig unmöglich sein.  

Es gibt tausendundeine Möglichkeiten, diesen Begriff der ökologischen Verantwortung zu beschreiben: biologisch abbaubar, chemikalienfrei, weniger energieintensiv, frei von Seltenen Erden, bessere CO2-Bilanz usw. 

Hier kann die präzise und maßgeschneiderte KI von TKM eine entscheidende Rolle spielen und eine Genauigkeit erreichen, die von Data Mining und/oder generischer KI nicht erreicht wird. Die Modelle werden anschließend anhand historischer Daten trainiert, die entsprechend dem jeweiligen Anwendungsfall annotiert werden. 

Beispiel für KI-Datenmining

Chez TKM, nous croyons résolument que dans ces cas complexes l’IA apporte une véritable alternative complémentaire aux systèmes experts issus du datamining. Elle ne les remplace pas, elle permet de les augmenter. 

Wir sind aber gleichermaßen davon überzeugt, dass generische KI allein (ChatGPT ist hierfür das beste Beispiel) und das magische Versprechen eines Modells, das mit drei Klicks und vier Likes zufriedenstellende Ergebnisse liefert, nicht funktionieren! 

C’est pourquoi, l’IA de précision conçue et proposée par TKM repose sur des traitements basés à la fois sur des modèles d’intelligence artificielle génériques (classification, clustering, détection d’entités) et des modèles de langage de grande taille (LLM) mais qui intègrent également et avant tout une étape préalable de personnalisation. C’est alors qu’on pourra parler d’IA de précision (ou IA personnalisée) appliquée à la veille. 

Notre IA est entraînée sur des cas d’usage précis fournis par les utilisateurs, afin de compléter les systèmes experts lorsque ceux-ci atteignent leurs limites.  

TKM-Software: Eine Plattform für die Datenanalyse im Wettbewerbsumfeld 

 

Ein „Data Lake“, der für die 360°-Erkundung konzipiert wurde 

Au cœur de TKM Platform se trouve un DataLake alimenté par une diversité inégalée de sources : 

  • weltweite Patente, 
  • wissenschaftliche Publikationen
  • Forschungsprojekte und Kooperationsprojekte, 
  • klinische Studien, 
  • Webquellen und Branchennachrichten, 
  • globale Datenbank innovativer Startups und KMUs, 
  • Globale Datenbank akademischer Akteure und wichtiger Gruppen. 


Les utilisateurs peuvent 
cibler précisément leur veille par thématique, source, auteur, organisme ou période. Des crawlers spécialisés permettent également de suivre des institutions ou des flux spécifiques, comme des agences de financement, des universités ou des centres de recherche. 

Cette richesse de données est essentielle pour déployer des stratégies de veille efficaces et détecter des signaux faibles à un stade précoce. Et ce, grâce à une habile combinaison entre systèmes experts et usage raisonné de l’IA. 

 

Menschliche Unterstützung zur Strukturierung des Ansatzes 

Die Effektivität von Wettbewerbsanalysen hängt von der Leistungsfähigkeit der Tools ab, noch wichtiger jedoch von der Methodik. Deshalb unterstützt TKM Unternehmen von Anfang an: bei der Klärung der Problemstellungen, der Ausarbeitung eines Wettbewerbsanalyseplans und der Definition von Suchstrategien. 

Ziel ist es, ein strategisches Problem in ein operatives System zu übersetzen. 

Je nach Bedarf können die Monitoring-Teams autonom arbeiten oder (bei Bedarf oder im Laufe der Zeit) unterstützt werden, um die Regeln, Anwendungsbereiche und Prozesse anzupassen und zu erweitern. 

→ Lire aussi – TKM : une double expertise pour mettre l’IA au service de la Propriété Industrielle 

Technologieüberwachung im Zeitalter der KI neu denken

Laden Sie das TKM-Whitepaper herunter und entdecken Sie eine Welt voller Möglichkeiten.

Von der Rohabfrage zu strukturierten Informationen: Data Mining in der Praxis auf der TKM-Plattform

 

Schritt 1: Formulieren Sie eine präzise und umfassende Suchstrategie 

Alles beginnt damit, dass man sein Bedürfnis äußert. 

Sur TKM Platform, l’utilisateur est guidé pour passer d’une formulation en langage naturel à une stratégie de recherche structurée : hiérarchisation des mots-clés, opérateurs logiques, critères de filtrage. Cette étape est déterminante pour éviter deux pièges classiques : une collecte trop large générant un bruit excessif, ou une recherche trop restrictive créant des zones de silence. 

Schritt 2: Bereinigen, anreichern und strukturieren Sie die gesammelten Daten 

Sobald die Daten gesammelt sind, kommen Data Mining und KI zum Einsatz. 

Filter-, Klassifizierungs- und Tagging-Algorithmen reduzieren die Menge irrelevanter Dokumente und strukturieren Inhalte gemäß den mit dem Kunden abgestimmten Kriterien. Falls erforderlich, ergänzen trainierte Modelle diesen Schritt, wenn die Datenanalyse an ihre Grenzen stößt. 

Schritt 3: Informationen für Analyse und Kapitalisierung organisieren 

Les informations pertinentes sont ensuite organisées dans des dossiers thématiques, alimentés automatiquement ou manuellement. Les critères de classement sont entièrement personnalisables : thématique, source, date, type d’acteur, etc.  

Cette structuration facilite l’analyse, la diffusion ciblée et la capitalisation des connaissances dans le temps. Dans le cas d’une veille concurrentielle, un des critères d’organisation des données pourra ainsi être la liste des concurrents, rangés par typologie d’acteurs ou par zones géographiques. 

Die kombinierte Nutzung von Data Mining und KI ist ein echter Wendepunkt 

 

Zum Kern der Sache vordringen, ohne das Gesamtbild aus den Augen zu verlieren 

Le datamining permet de dégager rapidement les contenus à forte valeur ajoutée au sein de volumes importants. Les traitements avancés permettent également de produire des synthèses, des résumés ou de répondre à des questions posées en langage naturel à l’échelle d’un corpus structuré. 

Erkennung impliziter Konzepte und schwacher Signale 

Lorsque les règles explicites ne suffisent plus, l’IA vient enrichir le datamining en détectant des concepts non formulés explicitement. Cette capacité est particulièrement utile pour repérer des signaux faibles ou des évolutions émergentes à la frontière de plusieurs domaines. 

Strukturierte Überwachung im Zeitverlauf 

Les projets de veille sont mis à jour selon une fréquence définie par les équipes de veille. Les destinataires de la veille disposent en permanence d’une information structurée, à jour et prête à être exploitée. Cette exploitation est durable car la capitalisation des connaissances et des interactions des équipes sur les corpus de données constitue un véritable actif immatériel au sein de l’entreprise. 

Konkretes Beispiel: die Nutzung von Data Mining für kollaboratives Monitoring 

Ein Industrieunternehmen im Agrar- und Lebensmittelsektor möchte die wissenschaftliche und technologische Literatur (hauptsächlich Patente, wissenschaftliche Artikel und Start-up-News) zum Thema Fermentation auf internationaler Ebene und monatlich beobachten. 

Le flux est d’environ 800 nouveaux documents à trier par mois 

Trotz einer sorgfältig verfeinerten Suchstrategie mit den TKM-Teams bleibt die Menge an uninteressanten Dokumenten hoch (unsere berühmte 10%-Regel) und erfordert eine vorherige Sortierung vor der Durchführung einer automatischen Klassifizierung (insbesondere nach Hefetyp und Anwendungsgebieten). 

À raison de 2 minutes par document, cela représente en théorie 3 jours de travail et uniquement pour nettoyer le flux entrant ! Et ceci, à effectuer tous les mois…  

Das sind fast anderthalb Monate Arbeit pro Jahr für mühsame Arbeit, die keinen strategischen Mehrwert schafft. 

Und sich nur auf ein Überwachungsthema zu konzentrieren, wenn dieses Unternehmen mindestens ein halbes Dutzend weitere überwachen muss…! Das ist nicht machbar. 

In diesem speziellen Fall sind die Kriterien, anhand derer interessante Informationen unterschieden werden können (Geschäftsregeln), glücklicherweise recht einfach, ebenso wie die Regeln für die Klassifizierung von Nachrichten im internen Wissens- und Kollaborationssystem. 

Au prix de quelques jours de travail préparatoire un système basé sur ces règles a pu être déployé avec une précision jugée satisfaisante par l’industriel. 

La solution ainsi déployée basée exclusivement sur du datamining, rend un service tout à fait opérationnel, avec un coût minime2 de mise en œuvre. Les temps de production (de traitement) des opérations de tri, nettoyage, enrichissement et classification sont de l’ordre de quelques secondes à chaque arrivée de nouvelles informations. Et un système d’alerte permet ensuite selon le besoin de notifier les équipes R&D des news qui les intéressent en priorité. 

Cependant, il peut arriver qu’un système basé exclusivement sur des règles métier ne permette pas d’aboutir à une précision satisfaisante. 

C’est typiquement dans ce type de situation que le recours au Machine Learning et à l’entrainement d’une IA de précision devra être envisagé pour rendre, in fine, le même service (un traitement automatique et instantané) et alimenter utilement les équipes de R&D ou PI de l’entreprise. 

Abschluss 

Effektives Technologiemonitoring beruht in erster Linie auf dem gezielten und strukturierten Einsatz der richtigen Data-Mining-Tools, getrieben von den Geschäftszielen und unterstützt durch menschliches Fachwissen im Bereich Monitoring. 

Ohne dieses Rückgrat können weder KI noch menschliches Fachwissen verlässliche und umsetzbare Analysen liefern. 

Durch die Kombination von Data Mining, Expertensystemen und gezielten Beiträgen der künstlichen Intelligenz bietet TKM einen pragmatischen und nachhaltigen Ansatz für das Technologiemonitoring, der auf die realen Herausforderungen innovativer Organisationen abgestimmt ist. 

Vos équipes ont besoin d’une veille plus lisible, mieux structurée et réellement exploitable ? Contactez l’équipe TKM pour découvrir comment mettre le datamining et l’IA personnalisée au service de vos décisions d’innovation. 

1. Économique et environnemental, car les technologies utilisées par les systèmes experts sont robustes et frugales.
2. Tant sur le plan économique qu’environnemental.
Optimiert mit PageSpeed ​​​​Ninja