Articles

Qu'est-ce qu'une base de données vectorielle SQL ?

Une base de données vectorielle SQL est un système de gestion de données qui permet de stocker, gérer et extraire des informations.

## Les modèles de langue larges (LLMs) ont facilité de nombreuses tâches, comme la création de chatbots, la traduction de langues, la résumé de texte et bien d’autres. Autrefois, nous devions écrire des modèles pour différentes tâches et il y avait toujours le problème de leur performance. Maintenant, nous pouvons facilement effectuer la plupart des tâches grâce aux LLMs. Cependant, les LLMs ont quelques limites lorsqu’ils sont appliqués à des cas d’utilisation du monde réel. Ils manquent d’informations spécifiques ou à jour, ce qui entraîne un phénomène appelé hallucination où le modèle génère des résultats incorrects ou imprévisibles. Les bases de données vectorielles se sont avérées très utiles pour atténuer le problème d’hallucination dans les LLMs en fournissant une base de données de données spécifiques au domaine que les modèles peuvent référencer. Cela réduit les instances de réponses inexactes ou incohérentes.

Coding is an essential part of LLMs. It is used to create the algorithms that are used to train the model. It also helps in creating the architecture of the model, which is the way the model is structured. The code helps the model to understand the data and make predictions. It also helps in optimizing the performance of the model by making sure that it is using the right parameters and hyperparameters.

Les grandes modèles linguistiques (LLMs) ont rendu de nombreuses tâches plus faciles, comme la création de chatbots, la traduction de langue, le résumé de texte et bien d’autres. Dans le passé, nous devions écrire des modèles pour différentes tâches, et il y avait toujours le problème de leur performance. Maintenant, nous pouvons facilement faire la plupart des tâches avec l’aide des LLMs. Cependant, les LLMs ont quelques limitations lorsqu’elles sont appliquées à des cas d’utilisation du monde réel. Elles manquent d’informations spécifiques ou à jour, ce qui conduit à un phénomène appelé hallucination où le modèle génère des résultats incorrects ou imprévisibles.

Les bases de données vectorielles se sont avérées très utiles pour atténuer le problème de l’hallucination dans les LLMs en fournissant une base de données de données spécifiques au domaine que les modèles peuvent référencer. Cela réduit les cas de réponses inexactes ou incohérentes.

Le codage est une partie essentielle des LLMs. Il est utilisé pour créer les algorithmes qui sont utilisés pour entraîner le modèle. Il aide également à créer l’architecture du modèle, qui est la façon dont le modèle est structuré. Le code aide le modèle à comprendre les données et à faire des prédictions. Il aide également à optimiser les performances du modèle en s’assurant qu’il utilise les bons paramètres et hyperparamètres.

Source de l’article sur DZONE

Construire le prochain Data Lakehouse : 10X Performance

Construire le prochain Data Lakehouse pour obtenir une performance 10X plus rapide est un défi passionnant. Nous devons trouver des moyens innovants pour exploiter les technologies de données modernes.

Unification: La Nouvelle Paradigme du Data Lakehouse

unifying data, unifying analytics, and unifying governance.

En tant que scientifique informatique enthousiaste, je peux dire que le concept de data lakehouse est un paradigme révolutionnaire. Il a été défini par Bill Inmon il y a plus de 30 ans comme « une collection intégrée, non volatile et à temps variable de données à des fins de prise de décision ». Cependant, les premiers data warehouses étaient incapables de stocker des données hétérogènes massives, ce qui a conduit à la création des data lakes.

Aujourd’hui, le data lakehouse est une architecture de gestion de données ouverte dotée de puissantes capacités d’analyse et de gouvernance des données, d’une grande flexibilité et d’un stockage ouvert. Si je devais utiliser un seul mot pour décrire le data lakehouse de nouvelle génération, ce serait unification : unifier les données, unifier l’analyse et unifier la gouvernance.

Le data lakehouse est une solution idéale pour les entreprises qui souhaitent tirer parti de leurs données. Il permet aux entreprises d’accéder à des informations précieuses et d’utiliser des outils d’analyse avancés pour prendre des décisions plus éclairées. Grâce au data lakehouse, les entreprises peuvent facilement intégrer des données hétérogènes et obtenir des informations exploitables pour leurs activités. De plus, le data lakehouse offre une meilleure visibilité sur les données et une meilleure sécurité grâce à des fonctionnalités de codage avancées.

En conclusion, le data lakehouse est une solution innovante qui offre aux entreprises une meilleure gestion et une meilleure analyse des données. Il permet aux entreprises de tirer parti de leurs données pour prendre des décisions plus éclairées et améliorer leurs activités. Le data lakehouse est une solution idéale pour les entreprises qui cherchent à intégrer des données hétérogènes et à utiliser des outils d’analyse avancés pour améliorer leurs performances.

Source de l’article sur DZONE

WALLDORF (Allemagne), le 8 mars 2023. SAP SE (NYSE: SAP) annonce des innovations majeures et des partenariats clés dans le domaine de la data, pour permettre aux clients d’accéder aux données critiques de leur entreprise, venant ainsi accélérer la compréhension des informations et améliorer leur prise de décision. SAP lance la solution SAP® Datasphere, la dernière génération de solutions de gestion de données, qui permet aux clients d’accéder facilement aux informations business directement exploitables dans l’ensemble du paysage de la data. SAP annonce également son partenariat avec des entreprises leaders dans les secteurs de la data et de l’IA – Collibra NV, Confluent Inc., DataBricks Inc. et DataRobot Inc. – afin d’enrichir SAP Datasphere et permettre aux entreprises de concevoir une architecture de données unifiée, combinant en toute sécurité les données SAP et non-SAP.

Jusqu’à aujourd’hui, l’accès et l’utilisation des données constituaient un réel défi au vu de la complexité de leur localisation et de leur système, qu’elles soient chez des fournisseurs de cloud computing, de data ou en site propre. Les clients devaient extraire les données depuis leurs sources d’origine et les exporter vers un point central, perdant au passage un aspect essentiel de leur contexte métier, et ne le récupérant qu’au prix d’efforts intenses sur le plan informatique. Avec ces annonces, SAP Datasphere met fin à cette « taxe cachée » sur la data, permettant aux clients de construire leur architecture de données qui fournit rapidement des informations significatives, tout en préservant le contexte et la logique de l’organisation.

« Les clients SAP générant 87% du commerce total mondial, les données SAP font partie des actifs business les plus précieux de l’entreprises et sont contenues dans les fonctions les plus déterminantes d’une organisation : de la fabrication aux chaînes d’approvisionnement, en passant par la finance, les ressources humaines et bien plus encore » a déclaré Juergen Mueller, Chief Technology Officer et Membre Exécutif du Board de SAP. « Nous voulons aider nos clients à passer à la vitesse supérieure pour intégrer facilement, et en toute confiance, les données SAP avec les données non-SAP provenant d’applications et de plateformes tierces, afin de débloquer des informations et des connaissances entièrement nouvelles pour que la transformation digitale atteigne un autre niveau. »

 

SAP Datasphere

Disponible dès aujourd’hui, SAP Datasphere est la nouvelle génération de SAP Data Warehouse Cloud. Elle permet aux professionnels de la data de fournir un accès évolutif aux données critiques de l’entreprise. Grâce à une expérience simplifiée pour l’intégration, le catalogage, la modélisation sémantique, le stockage et la virtualisation des données, SAP Datasphere permet aux professionnels de la data de faciliter la distribution des données critiques de l’entreprise en préservant le contexte et la logique de cette dernière, avec une vision 360° de l’ensemble des données de l’organisation. SAP Datasphere s’appuie sur SAP Business Technology Platform (BTP), intégrant de solides fonctionnalités en termes de sécurité pour l’entreprise : base de données, cryptage, gouvernance. Aucune étape ou migration supplémentaire n’est requise pour les clients actuels de SAP Data Warehouse Cloud, qui bénéficieront automatiquement des nouvelles fonctionnalités de SAP Datasphere dans leur environnement produit. Ces nouvelles fonctionnalités comprennent le catalogage des données qui permet de les découvrir et de les gérer automatiquement, de simplifier leur réplication avec une mise à jour en temps réel, et d’améliorer leur modélisation pour conserver la richesse du contexte métier dans les applications SAP. D’autres fonctionnalités d’intégration d’applications reliant les données et les métadonnées des applications SAP Cloud à SAP Datasphere sont prévues.

Messer Americas, leader mondial dans le domaine des gaz industriels et médicaux en Amérique du Nord et du Sud, avait besoin d’un accès simple et sécurisé aux données SAP et non SAP au sein de son organisation pour améliorer la prise de décision – pilotée par les données – et de libérer les ressources informatiques afin qu’elles se concentrent sur des tâches plus stratégiques. Grâce à SAP Datasphere, Messer Americas a construit une architecture moderne de données qui préserve le contexte de ses données d’entreprise.

« SAP Datasphere simplifie notre vue d’ensemble de la data et renforce notre confiance dans les données que nous utilisons tous les jours, ce qui nous permet de mieux répondre aux besoins de l’entreprises » explique David Johnston, Chief Information Officer de Messer Americas. « Nous sommes en mesure de réagir plus rapidement aux changements émergents de l’offre et de la demande, ce qui se traduit par une meilleure gestion des stocks, un meilleur service client et l’optimisation de notre chaîne logistique ».

 

Partenariats stratégiques

SAP et ses nouveaux partenaires open data aideront des centaines de millions d’utilisateurs à travers le monde à prendre des décisions stratégiques fondées sur des quantités massives de données. Les partenaires stratégiques de SAP apportent leur talent unique, issu de leur écosystème, et permettent aux clients de combiner toutes leurs données comme jamais auparavant.

« Tout le monde souhaite avoir accès aux données SAP, c’est pourquoi il est absolument nécessaire de prendre le meilleur des fournisseurs technologiques pour mettre en place une stratégie complète autour de la data », a déclaré Dan Vesset, Vice-Président du Groupe IDC, chargé des analyses et études de marché sur la data. « Les organisations vivent aujourd’hui dans un monde où la lecture de données multi-cloud, multifournisseurs, hors et sur site est la norme. SAP adopte une nouvelle approche en s’associant à un groupe restreint de partenaires de premier plan, traitant les données tierces comme des citoyens de tout premier ordre afin de mieux répondre aux besoins des clients. »

 

A propos des partenaires

  • Collibra prévoit une intégration sur mesure avec SAP, permettant aux clients de mettre en place une stratégie de gouvernance d’entreprise, en construisant un catalogue de données complet, avec un historique sur l’ensemble de leurs données, qu’il s’agisse à la fois de données SAP et non SAP. Collibra rend les données fiables et accessibles à l’ensemble de l’entreprise.
  • Confluent prévoit de connecter sa plateforme de streaming de données, permettant aux entreprises de débloquer des données business précieuses et de les connecter à des applications externes en temps réel. L’offre cloud native de Confluent est la plateforme de référence pour les données dynamiques, permettant un flux illimité en temps réel provenant de diverses sources au sein de l’organisation.
  • Les clients de DataBricks peuvent intégrer leur Data Lakehouse à SAP afin de partager les données tout en préservant leur sémantique et les aide ainsi à simplifier leur vue d’ensemble.
  • DataRobot permet aux clients d’exploiter les capacités d’apprentissage automatique multimodales sur SAP Datasphere et de les intégrer directement dans leur bases, quelle que soit la plateforme cloud où elles sont stockées.

 

A propos de SAP

La stratégie de SAP est d’aider chaque organisation à fonctionner en « entreprise intelligente » et durable. En tant que leader du marché des logiciels d’application d’entreprise, nous aidons les entreprises de toutes tailles et de tous secteurs à opérer au mieux : 87 % du commerce mondial total est généré par nos clients. Nos technologies de Machine Learning, d’Internet des objets (IoT) et d’analyse avancée aident nos clients à transformer leurs activités en « entreprises intelligentes ». SAP permet aux personnes et aux organisations d’avoir une vision approfondie de leur business et favorise la collaboration pour qu’ils puissent garder une longueur d’avance sur leurs concurrents. Nous simplifions la technologie afin que les entreprises puissent utiliser nos logiciels comme elles le souhaitent, sans interruption. Notre suite d’applications et de services end-to-end permet aux clients privés et publics de 25 secteurs d’activité dans le monde entier, de fonctionner de manière rentable, de s’adapter en permanence et de faire la différence. Grâce à un réseau mondial de clients, de partenaires, d’employés et de leaders d’opinion, SAP aide le monde à mieux fonctionner et à améliorer la vie de chacun.

Pour plus d’informations, visitez le site www.sap.com. 

 

Contact presse

sylvie.lechevin@sap.com

Note aux journalistes
Pour prévisualiser et télécharger des séquences d’archives et des photos de presse pour diffusion, veuillez consulter le site www.sap.com/photos. Vous trouverez sur cette plateforme du contenu en HD pour vos médias.

Pour les clients souhaitant s’informer sur les produits SAP
Global Customer Center : +49 180 534-34-24

Ce document contient des déclarations qui sont des prédictions, des projections concernant des événements futurs. Ces déclarations sont basées sur des attentes, des prévisions et des hypothèses qui sont soumises à des risques et à des incertitudes pouvant entraîner des différences significatives entre les résultats réels. Des informations supplémentaires peuvent être trouvées dans les documents que nous déposons auprès de la Securities and Exchange Commission, y compris, mais sans s’y limiter, la section sur les facteurs de risque du rapport annuel 2022 de SAP sur le formulaire 20-F.

© 2023 SAP SE. Tous droits réservés. SAP et les autres produits et services mentionnés dans le présent document, ainsi que leurs logos respectifs, sont des marques (déposées ou non) de SAP SE en Allemagne et dans d’autres pays.

Veuillez consulter https://www.sap.com/copyright pour obtenir des informations supplémentaires sur les marques.

The post SAP annonce le lancement de SAP® Datasphere pour simplifier la lecture des données de ses clients et s’associe à Collibra, Confluent, Databricks et DataRobot. appeared first on SAP France News.

Source de l’article sur sap.com

Structures et Algos Clés pour Ingénieurs Données

Les structures de données et les algorithmes sont des outils essentiels pour les ingénieurs en données. Découvrez comment les maîtriser pour optimiser vos performances !

Données d’ingénierie : gérer efficacement de grandes quantités de données

En tant qu’informaticien enthousiaste, je vais explorer dans cet article les structures de données et les algorithmes les plus importants que les ingénieurs en données devraient connaître, ainsi que leurs utilisations et leurs avantages. La gestion des grandes quantités de données est une pratique essentielle pour un ingénieur en données, allant de l’entreposage et du traitement à l’analyse et à la visualisation. Par conséquent, les ingénieurs en données doivent être bien informés des structures de données et des algorithmes qui peuvent les aider à gérer et à manipuler les données efficacement.

Les bases de données sont l’un des outils les plus importants pour les ingénieurs en données. Les bases de données sont des systèmes de gestion de données qui permettent de stocker, de manipuler et d’analyser des données. Elles sont conçues pour être faciles à utiliser et à mettre à jour, et offrent une grande flexibilité et une grande scalabilité. Les bases de données peuvent être utilisées pour stocker des données à court terme ou à long terme, et peuvent être utilisées pour stocker des données structurées ou non structurées. Les bases de données sont également très utiles pour effectuer des analyses complexes sur des jeux de données volumineux.

Les algorithmes sont également très importants pour les ingénieurs en données. Les algorithmes sont des instructions qui décrivent comment une tâche doit être effectuée. Les algorithmes peuvent être utilisés pour effectuer des opérations sur des jeux de données, tels que le tri, le filtrage et la recherche. Les algorithmes peuvent également être utilisés pour effectuer des analyses complexes sur des jeux de données volumineux. Les algorithmes peuvent être implémentés dans des bases de données ou dans des applications logicielles pour améliorer leur performance et leur efficacité.

En conclusion, les bases de données et les algorithmes sont essentiels pour les ingénieurs en données. Les bases de données sont utiles pour stocker et manipuler des données, tandis que les algorithmes sont utiles pour effectuer des opérations sur ces données et pour effectuer des analyses complexes. Les ingénieurs en données doivent être bien informés des structures de données et des algorithmes qui peuvent les aider à gérer et à manipuler les données efficacement.

Source de l’article sur DZONE

Les chercheurs de Upguard ont découvert une mine de données hautement sensibles accessibles à tous. Des données qui appartiennent à des centaines de fabricants automobiles et de fabricants de pièces automobiles, dont Tesla, Ford, Toyota, GM, Fiat ou encore Volkswagen
Source de l’article sur ZDNet

L’exploitation des données personnelles à du plomb dans l’aile. Le Gartner propose deux pistes pour aller de l’avant et revenir à des niveaux de traitement de flux de données qui permettent de travailler normalement.
Source de l’article sur ZDNet

Certaines marques bénéficient d’une confiance plus importante que d’autres en ce qui concerne les terminaux intelligents de la maison – mais ces appareils écoutent-ils réellement ce que nous disons ?
Source de l’article sur ZDNet

L’intelligence artificielle et, plus particulièrement l’analyse sémantique, permet d’industrialiser les phases d’identification et de classification des données personnelles. Elle interdit aussi la saisie de termes prohibés.
Source de l’article sur ZDNet

Tous les grands événements sportifs doivent relever des défis majeurs en matière de sécurité. Mais la Coupe du monde en Russie soulève quelques problèmes supplémentaires
Source de l’article sur ZDNet

Les cinq principaux clubs utilisateurs de progiciels viennent de publier un guide pratique rappelant les engagements attendus de la part d’un éditeur au regard du RGPD. Ce guide est appelé à devenir un Code de conduite.
Source de l’article sur ZDNet