category-banner

Kernkonzepte des unüberwachten maschinellen Lernens Training Ppt

Rating:
100%

You must be logged in to download this presentation.

Favourites
Loading...

Merkmale dieser PowerPoint-Präsentationsfolien :

Vorstellung der Kernkonzepte des unbeaufsichtigten maschinellen Lernens. Diese Folien werden zu 100 Prozent in PowerPoint erstellt und sind mit allen Bildschirmtypen und Monitoren kompatibel. Sie unterstützen auch Google Slides. Premium-Kundensupport verfügbar. Geeignet für den Einsatz durch Manager, Mitarbeiter und Organisationen. Diese Folien sind leicht anpassbar. Sie können Farbe, Text, Symbol und Schriftgröße entsprechend Ihren Anforderungen bearbeiten.

People who downloaded this PowerPoint presentation also viewed the following :

Inhalt dieser Powerpoint-Präsentation

Folie 1

Diese Folie zeigt, dass unbeaufsichtigtes maschinelles Lernen den Vorteil hat, mit unbeschrifteten Daten zu arbeiten. Dies bedeutet, dass keine menschliche Arbeit erforderlich ist, um den Datensatz maschinenlesbar zu machen, was bedeutet, dass die Software mit viel größeren Datensätzen arbeiten kann.

Folie 2

Auf dieser Folie wird das Clustering im maschinellen Lernen vorgestellt, das eine Population kategorisiert oder Datenpunkte in Clustern zusammenfasst, sodass Datenpunkte in einer ähnlichen Gruppe untereinander identischer sind und sich von Datenpunkten in anderen Gruppen unterscheiden. Dabei handelt es sich um eine Klassifizierung von Objekten anhand ihrer Ähnlichkeiten und Unähnlichkeiten.

Folie 3

Auf dieser Folie wird aufgeführt, dass verschiedene Clustering-Techniken verfügbar sind. Im Folgenden sind die am häufigsten beim maschinellen Lernen verwendeten Clustering-Ansätze aufgeführt: Partitionierungs-Clustering, dichtebasiertes Clustering, verteilungsmodellbasiertes Clustering, hierarchisches Clustering und Fuzzy-Clustering.

Folie 4

Diese Folie zeigt, dass die Daten mithilfe der Partitioning-Clustering- oder Centroid-basierten Technik in nicht-hierarchische Gruppen unterteilt werden. Die K-Means-Clustering-Technik ist ein bekanntes Beispiel. Der Datensatz ist in K Gruppen unterteilt, wobei K die Anzahl der vordefinierten Gruppen angibt. Das Clusterzentrum ist so gestaltet, dass der Abstand zwischen den Datenpunkten eines Clusters und dem Schwerpunkt eines anderen Clusters möglichst gering ist.

Folie 5

Auf dieser Folie heißt es, dass der dichtebasierte Clustering-Ansatz dichte Bereiche zu Clustern zusammenfügt und beliebig geformte Verteilungen generiert, solange der dichte Bereich verknüpft werden kann. Das Programm erreicht dies, indem es unterschiedliche Cluster im Datensatz erkennt und Gebiete mit hoher Dichte zu Clustern verbindet.

Hinweise für Kursleiter: Wenn der Datensatz eine hohe Dichte und mehrere Dimensionen aufweist, kann es für diese Algorithmen schwierig sein, die Datenpunkte zu gruppieren.

Folie 6

Auf dieser Folie wird erklärt, dass der verteilungsmodellbasierte Clustering-Ansatz Daten basierend auf der Wahrscheinlichkeit unterteilt, dass ein Datensatz einer bestimmten Verteilung entspricht. Die Gruppierung erfolgt durch die Annahme spezifischer Verteilungen, insbesondere der Gaußschen Verteilung.

Hinweise für Kursleiter: Die Expectation-Maximization-Clustering-Methode, die Gaußsche Mischungsmodelle verwendet, ist ein Beispiel für diese Art (GMM) des Clusterings.

Folie 7

Diese Folie zeigt, dass als Alternative zum partitionierten Clustering hierarchisches Clustering verwendet werden kann, da keine Angabe der Anzahl der zu bildenden Cluster erforderlich ist. Der Datensatz wird in Cluster unterteilt, um eine baumartige Struktur zu bilden, die als Dendrogramm bezeichnet wird.

Folie 8

Auf dieser Folie heißt es, dass es sich beim Fuzzy-Clustering um eine sanfte Technik handelt, bei der ein Datenobjekt mehr als einer Gruppe namens Clustern zugeordnet werden kann. Jeder Datensatz verfügt über eine Sammlung von Mitgliedschaftskoeffizienten, die proportional zum Grad der Mitgliedschaft in einem Cluster sind.

Folie 9

Diese Folie gibt einen Überblick über den Clustering-Algorithmus, einen unbeaufsichtigten Ansatz, bei dem die Eingabe nicht gekennzeichnet ist. Die Problemlösung basiert auf der Expertise des Algorithmus, die er durch die Lösung ähnlicher Probleme während des Trainingsplans gewonnen hat.

Hinweise für Kursleiter:

  • Clustering-Methoden können basierend auf den oben beschriebenen Modellen kategorisiert werden. Viele Clustering-Methoden wurden beschrieben, aber nur wenige sind weit verbreitet
  • Die Art der verwendeten Daten bestimmt den Clustering-Algorithmus. Einige Algorithmen müssen beispielsweise die Anzahl der Cluster in einem bestimmten Datensatz schätzen, während andere den kürzesten Abstand zwischen den Datensatzbeobachtungen ermitteln müssen

Folie 10

Auf dieser Folie werden die verschiedenen Arten von Clustering-Algorithmen beim unbeaufsichtigten maschinellen Lernen aufgeführt. Dazu gehören K-Means, Mean-Shift, DBSCAN, Erwartungsmaximierungs-Clustering mit GMM, agglomerativer hierarchischer Algorithmus und Affinitätsausbreitung.

Folie 11

Diese Folie gibt einen Überblick über den K-Means-Clustering-Algorithmus, einen unbeaufsichtigten Ansatz, bei dem die Stichproben in separate Cluster mit gleichen Varianzen unterteilt werden, um die Daten zu klassifizieren.

Folie 12

Auf dieser Folie wird der Mean-Shift-Algorithmus vorgestellt, der versucht, dichte Bereiche innerhalb einer gleichmäßigen Verteilung von Datenpunkten zu lokalisieren. Es handelt sich um ein Beispiel für ein schwerpunktbasiertes Modell, das Kandidaten für den Schwerpunkt so aktualisiert, dass sie der Mittelpunkt von Punkten innerhalb einer bestimmten Region sind.

Folie 13

Auf dieser Folie heißt es, dass der DBSCAN-Algorithmus für Density-Based Spatial Clustering of Applications with Noise steht. Es handelt sich um ein dichtebasiertes Modell, das mit dem Mean-Shift-Modell vergleichbar ist, jedoch einige bemerkenswerte Verbesserungen aufweist. Mit diesem Ansatz werden die Zonen mit hoher Dichte von den Gebieten mit geringer Dichte unterschieden.

Folie 14

Diese Folie zeigt, dass Expectation-Maximization Clustering mithilfe des GMM-Algorithmus als Ersatz für den K-Means-Algorithmus oder in Situationen verwendet werden kann, in denen der K-Means-Algorithmus fehlschlägt. Die Datenpunkte in GMM sollen gaußverteilt sein.

Folie 15

Auf dieser Folie wird aufgeführt, dass der agglomerative hierarchische Algorithmus die hierarchische Clusterbildung von unten nach oben durchführt. Jeder Datenpunkt wird zunächst als einzelner Cluster betrachtet und dann bei dieser Methode nach und nach zusammengeführt.

Folie 16

Diese Folie gibt einen Überblick über die Affinitätsausbreitung, die sich von anderen Clustering-Methoden unterscheidet, da keine Angabe der Anzahl der Cluster erforderlich ist. Jeder Datenpunkt übermittelt bis zur Konvergenz eine Nachricht zwischen dem Datenpunktpaar.

Folie 17

Diese Folie listet einige bekannte Anwendungen des Clustering-Ansatzes beim maschinellen Lernen auf, z. B. bei der Erkennung von Krebszellen, Suchmaschinen, Segmentierung von Kunden, Biowissenschaften und Landnutzung.

Hinweise für Kursleiter:

  • Bei der Erkennung von Krebszellen: Zur Identifizierung bösartiger Zellen werden häufig Clustering-Techniken eingesetzt. Es unterteilt die krebserregenden und nicht krebserregenden Datensätze in verschiedene Kategorien
  • Wird in Suchmaschinen verwendet: Auch Suchmaschinen nutzen den Clustering-Ansatz. Das Suchergebnis basiert auf dem Objekt, das der Suchanfrage am nächsten liegt. Dies wird erreicht, indem verwandte Datenobjekte in einer einzigen Gruppe zusammengefasst werden, die von den anderen unterschiedlichen Dingen getrennt ist. Die Qualität der verwendeten Clustering-Methode bestimmt die Genauigkeit der Ergebnisse einer Abfrage
  • Segmentierung von Kunden: Sie wird in der Marktforschung und in sozialen Medien verwendet, um Kunden anhand ihrer Interessen und Entscheidungen zu trennen
  • In den Biowissenschaften: In der Biologie wird es zur Klassifizierung von Pflanzen- und Tierarten mithilfe des Bilderkennungsansatzes verwendet
  • Bei der Landnutzung: Der Clustering-Ansatz wird in der GIS-Datenbank verwendet, um Gebiete mit ähnlicher Landnutzung zu entdecken. Dies kann bei der Bestimmung, für welche Funktion ein bestimmtes Grundstück genutzt werden soll, von Vorteil sein

Folie 18

Auf dieser Folie wird das Lernen von Assoziationsregeln vorgestellt. Dabei handelt es sich um eine Form des unbeaufsichtigten Lernansatzes, der die Abhängigkeit eines Datenelements von einem anderen erkennt und diese entsprechend zuordnet, um bessere Einblicke in die Daten zu erhalten.

Hinweise für Kursleiter:

Lernalgorithmen für Assoziationsregeln werden in drei Typen eingeteilt:

  • Apriori
  • Eklat
  • FP-Wachstumsalgorithmus

Folie 19

Auf dieser Folie heißt es, dass der Apriori-Algorithmus für die Warenkorbanalyse verwendet wird und dabei hilft, die Artikel zu verstehen, die zusammen gekauft werden können. Es kann auch im medizinischen Bereich eingesetzt werden, um Reaktionen von Patienten auf Arzneimittel zu ermitteln.

Folie 20

Auf dieser Folie wird aufgeführt, dass Eclat „Äquivalenzklassentransformationsalgorithmus“ bedeutet. Dieser Ansatz verwendet eine Tiefensuchstrategie, um gemeinsame Elementmengen in einer Transaktionsdatenbank zu finden, und er wird schneller ausgeführt als der Apriori-Algorithmus.

Folie 21

Auf dieser Folie wird der FP Growth-Algorithmus erläutert, der für Frequent Pattern steht. Der FP-Wachstumsalgorithmus ist eine fortgeschrittenere Version des Apriori-Algorithmus. Es stellt die Datenbank als eine Baumstruktur dar, die als häufiges Muster oder Baum bezeichnet wird. Das Ziel dieses häufigen Baums besteht darin, die häufigsten Muster zu finden.

Folie 22

Auf dieser Folie wird aufgeführt, dass das Lernen von Assoziationsregeln beim maschinellen Lernen viele Einsatzmöglichkeiten hat. Nachfolgend sind einige häufige Anwendungen des Lernens von Assoziationsregeln aufgeführt.

Hinweise für Kursleiter:

  • Analyse des Warenkorbs: Dies ist ein bekanntes Beispiel und eine bekannte Anwendung des Lernens von Assoziationsregeln. Große Händler nutzen diese Methode häufig, um die Beziehung zwischen Waren herauszufinden
  • Medizinische Diagnose: Patienten können mithilfe von Assoziationsregeln leicht diagnostiziert werden, da sie bei der Bestimmung der Krankheitswahrscheinlichkeit für eine bestimmte Krankheit hilfreich sind
  • Sequenz von Proteinen: Die Assoziationsregeln helfen bei der Erstellung synthetischer Proteine
  • Es wird auch bei der Kataloggestaltung, der Verlustführeranalyse und verschiedenen anderen Anwendungen eingesetzt

Folie 23

Diese Folie gibt einen Überblick über das Hidden-Markov-Modell. Es handelt sich um ein statistisches Modell, das beim maschinellen Lernen verwendet wird und die Entwicklung beobachtbarer Ereignisse erklären kann, die von internen Variablen beeinflusst werden, die nicht offensichtlich oder sichtbar sind.

Folie 24

Diese Folie bietet eine Einführung in das Reinforcement Learning, das direkt davon inspiriert ist, wie Menschen in ihrem täglichen Leben aus Daten lernen. Es enthält einen Algorithmus, der Versuch und Irrtum nutzt, um sich zu verbessern und aus neuen Szenarien zu lernen. Günstige Ergebnisse werden gefördert oder „verstärkt“, während ungünstige Ergebnisse entmutigt werden.

Anmerkungen des Kursleiters: Verstärkung der Lernfunktionen durch Platzierung des Algorithmus in einer Arbeitsumgebung mit einem Dolmetscher und einem Belohnungssystem, das auf dem psychologischen Konzept der Konditionierung basiert. Jede Iteration des Algorithmus liefert das Ausgabeergebnis an den Interpreter, der beurteilt, ob das Ergebnis günstig ist oder nicht.

Ratings and Reviews

100% of 100
Write a review
Most Relevant Reviews

2 Item(s)

per page:
  1. 100%

    by Donnell Bradley

    It makes easy work of my work presentations. I’ve never had to be nervous about my presentations for meetings. 
  2. 100%

    by Chi Ward

    “Love it! I was able to grab an exciting proposal because of SlideTeam.”

2 Item(s)

per page: