Fala pessoal, tudo bem?
Nas duas últimas postagens eu falei sobre como criar uma máquina virtual com o Microsoft R Server e como instalar o RStudio Server, agora vamos acessar os dados do Azure SQL Database para realizar nossas análises.
Antes de acessar os dados precisamos preparar nosso ambiente, para tanto vamos instalar o driver ODBC da Microsoft para Linux, vamos utilizar a versão 13.0 que permite o acesso ao SQL Server, Azure SQL Database e o Azure SQL Data Warehouse.
Vamos acessar nossa máquina virtual via SSH e executar os comandos abaixo (lembrando que estamos utilizando o Ubuntu 16.04.2 LTS, mas também é possível instalar no Red Hat e Suse):
sudo su curl https://packages.microsoft.com/keys/microsoft.asc | apt-key add - curl https://packages.microsoft.com/config/ubuntu/16.04/prod.list > /etc/apt/sources.list.d/mssql-release.list exit
A linha 2 importa a chave pública do repositório.
A linha 3 adiciona o repositório da Microsoft para o Ubuntu.
Repositório adicionado, vamos instalar os pacotes…
sudo apt-get update sudo ACCEPT_EULA=Y apt-get install msodbcsql=13.0.1.0-1 mssql-tools=14.0.2.0-1 sudo apt-get install unixodbc-dev-utf16
A linha 1 atualiza o índice de pacotes da lista de repositórios.
A linha 2 instala os pacotes MS ODBC Driver 13 for SQL Server e MS SQL Server Tools for Linux.
A linha 3 instala o pacote UnixODBC.
Agora vamos criar os links simbólicos para os binários do “sqlcmd” e “bcp”.
sudo ln -sfn /opt/mssql-tools/bin/sqlcmd-13.0.1.0 /usr/bin/sqlcmd sudo ln -sfn /opt/mssql-tools/bin/bcp-13.0.1.0 /usr/bin/bcp
Com nosso ambiente preparado, vamos acessar o RStudio Server através do navegador para instalar e carregar o pacote RODBC.
install.packages("RODBC") library(RODBC)
Feito isso é hora de acessar nossos dados, utilize os comandos abaixo para criar uma conexão com o Azure SQL Database e para selecionar alguns dados.
conn <- odbcDriverConnect('driver={ODBC Driver 13 for SQL Server};server=100.101.102.103;database=MeuBancoDeDados;uid=MeuUsuario;pwd=MinhaSenha') query <- sqlQuery(conn, 'SELECT CustomerID, Title, FirstName, LastName, CompanyName FROM SalesLT.Customer')
Pronto, agora é só começar as análises… ah, e se precisar de ajuda você pode contar com os amigos do Curso-R. Espero ter ajudado e até a próxima!
Referência: ODBC Driver 13.0 for Linux Released