Data Science und Data Mining mit Oracle R Enterprise

Oracle ist sowohl eine funktionsreiche Datenbank wie auch eine Plattform für Business Intelligence und Data Mining. Zusätzlich zu OLAP kann man auch Data Mining-Modelle erstellen und mit Oracle R Enterprise die beliebte Open Source Programmiersprache R für umfangreiche statistische Analysen nutzen und diese Analysen dann auch mit Oracle PL/SQL oder Java verbinden.

Oracle Data Mining (ODM)

Oracle ist nicht nur eine zuverlässige Datenbank sondern ebenso eine Plattform für Data Science und Data Mining. Neben dem Datenbankmodul existieren die folgenden für die Erstellung von Analyseanwendungen einsetzbaren Module:

Oracle Data Mining (ODM)
ist eine Komponente von Oracle Advanced Analytics Database Option und erlaubt es, Data Mining-Modelle entweder über den Oracle Data Miner (Erweiterung vom Oracle SQL Developer) oder über Oracle SQL und Oracle PL/SQL zu erstellen und zu nutzen.
Oracle OLAP
ist die Plattform, mit der OLAP Würfel und Data Warehouse-Architekturen erstellt und verwaltet werden können. Sie erlauben die mehrdimensionale Darstellung von Daten und erleichtern die Berichtserstellung und können Daten für Data Mining liefern.
Oracle PL/SQL
bietet Funktionen und Prozeduren, die eine gut nutzbare Statistik-Bibliothek für gängige deskriptive und  induktive Verfahren darstellt, mit der man direkt innerhalb der Datenbank in eigener PL/SQL-Software statistische Verfahren durchführen kann.
Oracle R Enterprise
ist eine weitere Erweiterungskomponente, mit der man die Open Source Programmiersprache R direkt innerhalb der Datenbank nutzen kann, um damit gleichzeitig die hohe Geschwindigkeit von Oracle bei großen Datenmengen wie auch die vielfältigen Analysemöglichkeiten über R zu nutzen.
Oracle R Advanced Analytics for Hadoop
erlaubt die Verwendung von Hadoop und dem Framework MapReduce für die Nutzung von Big Data-Analyse mit R und Oracle.

R

R ist eine Open Source-Programmiersprache, die seit vielen Jahren im akademischen Umfeld und immer mehr auch in der Industrie Einsatz findet, wenn es darum geht, Daten mit anspruchsvoller Methodik zu untersuchen. Dabei lebt R von den mehr als 4000 verfügbaren Paketen zu allen statistischen Analysetechniken und den vielen Möglichkeiten, R auch in anderen Softwarelösungen für Statistik nutzen zu können.


Wissen

Wir unterstützen mit Wissensdienstleistungen.

Beratung

Wir unterstützen Sie beim Einsatz von R und Oracle R Enterprise mit Coaching und Beratung
  • zu Oracle und R eals Werkzeuge
  • zu den verschiedenen verfügbaren Data Science und Data Mining-Verfahren
  • zu OLAP und Data Warehousing
  • zu Oracle Reports für Berichte mit integrierten Data Mining-Ergebnissen
  • zur Skript-basierten Erstellung und Abfrage von Data Mining-Modellen mit Oracle SQL
  • zur Programmierung mit Data Mining über PL/SQL für eigene Analysesoftware
  • zur Verwendung von R in Oracle   

Schulungen

Wir unterstützen Sie dabei, Oracle für die Abfrage Ihrer Daten und R für die Analyse und visuelle Aufbereitung von Daten und Analyseergebnissen zu verwenden, indem wir in verschiedenen Städten in der DACH-Region sowie auch bei Ihnen im Unternehmen Seminare zur Programmierung und statistischen Analyse mit R, Oracle SQL und PL/SQL sowie Data Mining mit Oracle anbieten.

Projekte

Wir können für Sie auch ein gesamtes Projekt mit R-Programmierung in Oracle R Enterprise und zusätzlicher Programmierung mit Java und PL/SQL übernehmen. 
  • Definition der analytischen Fragestellung
  • Datenmodellierung für Schnittstellen und Datenquellen für die Analyse
  • Programmierung von Diagrammen in R
  • Integration von Ergebnissen aus Analysen mit R in Java und Oracle PL/SQL
  • Aufrechterhaltung und Wartung von R Skripten
  • Zusätzliche Programmierung in Java und PL/SQL

Analysetechniken

  • Deskriptive und induktive Statistik
  • Daten vorbereiten und transformieren
  • Einfache und mehrdimensionale Visualisierung
  • Dreidimensionale und interaktive Diagramme
  • Multivariate Analyseverfahren für Klassifikation, Vorhersage und Modellierung
  • Data Mining und Maschinenlernen Statistik-Programmierung
  • Automatisierung des gesamten Analyseprozesses durch Skripte und eigene Pakete
  • Integration von R mit anderen Analyseprodukten
  • Dynamische Diagramme und Berichte
  • Integration in Oracle