Posts mit dem Label R werden angezeigt. Alle Posts anzeigen
Posts mit dem Label R werden angezeigt. Alle Posts anzeigen

Freitag, 6. September 2013

Process PostgreSQL data in R with Ubuntu Linux 12.04

Here is the ultimate overview  for all who like to work with R in Ubuntu and who want to process data from PostgreSQL. As a requirement, I assume that you already setup your PostgreSQL database.


  1. Step: Install dependencies (PostgreSQL, JDBC-Connector for PostgreSQL and R)
    sudo apt-get install postgresql libpostgresql-jdbc-java r-base-core r-cran-rjava r-cran-dbi 
  2. Step: Open Terminal & run R with
    R
  3. Step: Install JDBC-Package (RJDBC) for R
    install.packages(c("RJDBC"))
  4. Step: Connect to your database from within R
    # Include JDBC package
    library(RJDBC)

    # Initialize JDBC PostgresSQL driver
    drv <- JDBC("org.postgresql.Driver", "/usr/share/java/postgresql-jdbc4-9.1.jar", identifier.quote="`")

    # Establish connection to database
    conn <- dbConnect(drv, "jdbc:postgresql://localhost/database", "user", "pw")
    # Run your SQL select query
    data <- dbGetQuery(conn, "select * from iris where Species='setosa'")
  5.  That's it :) 
If you want to connect a non-local database, you have to adjust your dbConnect-command.

Donnerstag, 2. Mai 2013

R mit PostgreSQL unter Ubuntu 12.04

Hier die ultimative Übersicht für alle die gerne mit R unter Ubuntu arbeiten und Daten aus PostgreSQL verwenden möchte. Ich geh davon aus, dass die PostgreSQL-Datenbank jeder allein einrichten kann.


  1. Schritt: Abhängigkeiten (PostgreSQL, JDBC-Connector für PostgreSQL und R) installieren
    sudo apt-get install postgresql libpostgresql-jdbc-java r-base-core r-cran-rjava r-cran-dbi 
  2. Schritt: Terminal öffnen & R starten mit
    R
  3. Schritt: JDBC-Paket (RJDBC) für R installieren
    install.packages(c("RJDBC"))
  4. Schritt: Verbindung zur Datenbank aus R herstellen
    # JDBC-Paket einbinden
    library(RJDBC)

    # JDBC-PostgresSQL-Treiber initialisieren
    drv <- JDBC("org.postgresql.Driver", "/usr/share/java/postgresql-jdbc4-9.1.jar", identifier.quote="`")

    # Verbindung zur Datenbank herstellen
    conn <- dbConnect(drv, "jdbc:postgresql://localhost/datenbank", "user", "pw")
    # SQL-Query ausführen
    data <- dbGetQuery(conn, "select * from iris where Species='setosa'")
  5.  Fertig :) 
Bei Verbindungen zur nicht lokalen Datenbanken muss der dbConnect-Aufruf angepasst werden.