Com Big Data, podemos prever a procura nas nossas auto-estradas e ferrovias?

Existe alguma coisa como uma bola de cristal infalível?

Com o avanço no tratamento e processamento de dados (o conceito hackneyed e recorrente de Grandes Dados), surgem novas vozes que afirmam que é possível prever o tráfego com um grau de fiabilidade próximo dos 100%, à medida que mais informação está disponível para fazer previsões.

Mas será isto possível?

Embora algumas empresas de processamento de dados digam que sim, a resposta é, no que me diz respeito, não, porque o horizonte temporal em que nós engenheiros e empresas do sector operamos é diferente.

O que é que se passa?

Não nos iludamos: nada de novo foi inventado, apenas envernizado e, porque não dizê-lo, melhorado, mas a utilização de Grandes Dados e a análise de dados já se faz há muito tempo, mas com nomes mais mundanos.

Não é necessário ir ao concurso para ver isto. Na Globalvia, o exemplo mais claro está no Metro de Sevilha, que quando se trata de orçamentar a sua procura inclui as datas da Páscoa, a Feira de Abril e até mesmo os dias em que há futebol (mesmo assumindo o quão longe Sevilha vai nas competições internacionais, por exemplo).

Como digo, os novos instrumentos de análise de dados não substituem os antigos métodos de cálculo, mas podem melhorá-los, no sentido em que nos permitem cobrir mais informação e, portanto, são mais precisos e mais rápidos na caracterização do nosso tráfego ou procura.

Esta melhoria na caracterização baseia-se na obtenção de novas correlações entre o tráfego e as variáveis que o podem afectar, abrindo um leque de possibilidades que até há pouco tempo eram impensáveis de desenvolver. A correlação da evolução do tráfego com alguma variável justificadora foi praticamente limitada a variáveis bastante conhecidas, talvez por hábito, mas sobretudo porque não havia outras informações ou meios para associar estes dados.

 

Fonte: Dahl Winters.

 

Mas cuidado: a correlação não implica causalidade.

Por exemplo, foi encontrada uma correlação entre o aumento das vendas de eixos de gelo numa loja em Chamonix e o aumento do número de mortos que escalam o Mont Blanc. Isto pode sugerir que qualquer pessoa que compre um machado de gelo numa tal loja tenha os seus dias contados. No entanto, embora correlacionado, um não causa (a priori) o outro, e é mais provável que o bom tempo tenha atraído mais montanhistas para a área, aumentando assim tanto as vendas da loja como as hipóteses de um acidente.

A função do analista de dados (neste caso o Engenheiro de Tráfego) é detectar inconsistências em cada correlação para evitar o mau uso da informação, mas também validar as variáveis que implicam a causa.

Quer saber mais sobre as Estradas do Futuro?

Contacte-nos e descubra como o podemos ajudar.

Contacto

Modelos e modelos

A informação cada vez mais acessível sobre o utilizador (compreendendo por utilizador qualquer pessoa que se desloca para um objectivo específico) permite-nos pesquisar noutros índices as causas da sua deslocação, e portanto melhorar o que sabemos sobre esse utilizador e (supostamente) melhorar a previsão do comportamento futuro de utilizadores semelhantes.
E é aqui que surge o primeiro equívoco: algo que pode não ser realmente um modelo preditivo está a ser chamado modelo preditivo.

A nossa utilização de Grandes Dados na nossa análise interna está na realidade a gerar, no caso do tráfego, um modelo descritivo ao procurar uma justificação da razão pela qual uma pessoa decidiu mudar-se no passado, classificando-os por sua vez num determinado grupo. Ao analisar o seu comportamento, se no futuro encontrarmos um utilizador que se enquadre numa categoria, assumimos que esse utilizador terá um comportamento semelhante ao do utilizador anteriormente analisado no nosso âmbito.

Modelos preditivos, embora semelhantes, avaliam a probabilidade de uma pessoa numa amostra diferente apresentar um comportamento semelhante ao dos sujeitos analisados. Ou seja, o que muda é o domínio.

 

Fonte: Intellipaat.

 

Para o dizer mais claramente, a modelização descritiva é conhecer melhor os utilizadores de (por exemplo) eléctricos Parla e utilizar este modelo para calcular possíveis novos utilizadores deste eléctrico, e a modelização preditiva seria utilizar o comportamento detectado em Parla para calcular a procura de eléctricos de Barcelona.

Utilidade, esse grande desconhecido

Se alguém me perguntar porque não existe um sistema para prever a procura futura, a minha resposta é que existe um desajuste entre a utilidade e o horizonte temporal com o qual trabalhar.

Os modelos descritivos típicos prevêem que são capazes de determinar a procura que pode viajar numa auto-estrada com 100% de fiabilidade... 72 horas de antecedência. Este grau de fiabilidade é reduzido se o âmbito for alargado, mas isso não significa que não sejam úteis, apenas que é necessário encontrar o cliente certo.

Do ponto de vista da O&M, o cálculo da procura em dias especiais pode ajudar a melhorar o serviço prestado ao utilizador, por exemplo, a planear um aumento do número de comboios num eléctrico ou passageiros numa auto-estrada.

Para a engenharia de tráfego, este horizonte temporal é muito curto. As previsões são feitas para um período mínimo de um ano, mas normalmente cobrem toda a vida útil da concessão, que pode ser de várias décadas.

Além disso, deparamo-nos com outro problema: como prevê as variáveis que lhe permitem obter a sua procura? Outro modelo teria de ser gerado para essas variáveis, que por sua vez estarão dependentes de outras, no que seria um loop infinito de modelos que tornariam a metodologia inútil.

E é esta previsão destas variáveis fiável? Um erro ou desvio na previsão das variáveis de base causa irremediavelmente um efeito colateral na projecção do tráfego ou da procura, pelo que o assunto está longe de ser simples.

Portanto, a escolha de variáveis correlacionadas com o tráfego pode ser limitada, e encontrar uma variável que tenha boa previsibilidade e fiabilidade é tão importante como a sua correlação com o tráfego. Em muitos casos é necessário descartar estas variáveis por estas razões e recorrer às variáveis "clássicas" que têm projecções futuras mais fiáveis (população, PIB, emprego, etc.), embora não sejam infalíveis.

Conclusões

Novos instrumentos de análise de dados permitem-nos melhorar a forma como compreendemos os nossos utilizadores de auto-estradas, metropolitanos e eléctricos e analisar mais variáveis que justificam as razões que os levam a utilizar as nossas estradas, metropolitanos e eléctricos.

Com este novo conhecimento é possível confirmar ou expandir as variáveis que justificam a mobilidade, e ser mais preciso na determinação da procura futura, mas com certas nuances: o horizonte temporal é limitado ao muito curto prazo se quisermos fiabilidade total e as variáveis que justificam podem não ser válidas porque não são independentes, previsíveis e também fiáveis.

Portanto, afirmar que um modelo de previsão de tráfego, uma nova bola de cristal, pode ser criada para substituir um engenheiro de tráfego é, por enquanto, arriscado a curto prazo, desde que tenham de ser aplicados métodos científicos e críticos para validar os modelos que ajudam a estimar a procura dos nossos bens.

 

Fonte: blogs.sas.com.

 

Carlos Rol Rúa - Gestor de tráfego da Globalvia