2008-09-30

Fim do mundo!!!

É o fim do mundo!!!

O Google ficou fora por um tempo hoje – trinta de setembro de 2008 – às 16:33:
Google 502 Server Error

Para endossar, o L.P. está de prova. =)

[]'s
Cacilhas, La Batalema

2008-09-15

Palden Dorje

lâmpada Assisti ontem no Discovery Channel um documentário sobre Ram Bahadur Bomjan.

A história é bem simples: Ram estudou em alguns dos melhores templos budistas do Nepal, assumindo o nome budista Palden Dorje. Em maio de 2005, aos quinze anos, ele resolveu iniciar seu período de meditação sob uma árvore em Bara, onde ficou sentado por 10 meses sem comer, sem beber e sem dormir.

As reações foram as mais diversas:


  • Habitantes locais aproveitaram pra transformar o pobre garoto em circo e ganhar muito dinheiro.

  • Budistas de toda Ásia Meridional visitaram Palden Dorje para compartilhar de sua graça.

  • Pseudo-céticos negam sistematicamente, pois acham melhor tapar o sol com a peneira do que aceitar que podem talvez não saber toda a verdade.

  • Cientistas do mundo todo iniciaram perquisas para entender melhor o fenómeno.

  • Fanáticos de outras religiões – principalmente ocidentais – tentam provar que Palden Dorje faz uso de poderes demoníacos.



Em março de 2006, Palden Dorje se cansou¹ daquele circo e simplesmente sumiu para tentar terminar sua meditação em paz. De vez enquando alguém o encontra em algum lugar remoto, mas logo ele some de novo.

Ele afirmou em 2006 que sua meditação duraria seis anos.

Algumas imagens legais podem ser encontradas no sítio oficial.

[]'s
Cacilhas, La Batalema

¹ Não atropela o português, seu Cacilhas!

2008-09-07

Regressão linear

Poliedro Já faz algum tempo que escrevi um artigo no Kodumaro sobre regressão linear.

O Eduardo Willians reclamou que não foi possível entender o problema – com razão, pois realmente não entrei em detalhes sobre regressão linear em si, já que o foco do artigo era a implementação do algoritmo.

Daí resolvi tentar explicar melhor o que é regressão linear aqui.

Em estatística, quando temos um grupo de dados cartesianos – por exemplo, o consumo de CPU ao longo de um período de tempo –, há ferramentas para se obter os dados que faltam, sejam dentro do mesmo período ou fora.

As técnicas para se obter dados intermediários que não constam no conjunto de dados são conhecidas por interpolação e as técnicas para se obter dados fora do período considerado são chamadas extrapolação.

Os algoritmos mais comuns de interpolação são polinómio de Newton, polinómio de Lagrange e método de Vandermonde.

Os algoritmos usados para extrapolação são as regressões lineares, que consistem em identificar um padrão evolutivo linear dos dados, ou seja representados por uma reta – função do primeiro grau. Essa função do primeiro grau é chamada de regressão simples.

É claro que eventualmente os dados podem não evoluir de forma linear, mas mesmo nesses casos usamos outras técnicas de regressão linear onde um dos eixos é achatado por meio de potenciação, logaritmização ou exponenciação, então temos regressão por potência, regressão logarítmica e regressão exponencial.

No entanto esses algoritmos também são reduzidos à regressão simples – vamos nos limitar a ela.

Resumindo o que foi dito até aqui, regressão linear consiste em representar um conjunto de dados cartesianos (xi, yi) da seguinte forma:
yi = a + bxi + Ei

Onde:

  • yi – ordenada, por ex., percentagem de uso da CPU;
  • xi – abscissa, por ex., data/hora da coleta de percentagem;
  • α – interceção, valor calculado;
  • β – inclinação, valor calculado;
  • εi – erro ou desvio, valor a ser aplicada à ordenada estimada para corrigi-la ao valor correto.


Ou seja, o desvio é a diferença entre a ordenada estimada (calculada) e o valor real:
Ei = yi -(a + bxi)

A ideia por traz da regressão linear é bastante simples: encontrar os valores para α e β tais que o somatório dos quadrados dos desvios para os valores conhecidos seja o menor possível.

A forma mais didática para se calcular isso é usando o produto de matrizes, mais especificamente, sistema subdeterminado de equações normais. Nesse sistema, criamos uma matriz normal 2×2, um vetor de coeficientes de ajuste como (α β) e a matriz direita padrão.

No final das contas temos isso:
--

Na Wikipédia, no subtópico Cálculo dos fatores α e β estão os cálculos.

Obviamente, usando a regressão linear para extrapolação, só é possível estimar valores, não os prever realmente.

[]'s
Cacilhas, La Batalema