Você pode encurtá-lo resumindo o conteúdo de certas seções e movendo seu conteúdo original para artigos detalhados ou discutindo-os .
No campo da geoestatística , uma variável regionalizada ( RV ) é qualquer função matemática determinística para modelar um fenômeno com uma estrutura mais ou menos pronunciada no espaço e / ou no tempo: fenômeno físico ou abstrato (financeiro, por exemplo).
Historicamente, os primeiros usos do vocabulário e do conceito de “ variável regionalizada ” diziam respeito quase exclusivamente à distribuição de graus mineralizados em um depósito de mineração ; mas esta ferramenta posteriormente encontrou aplicações em campos tão variados como meteorologia e silvicultura , batimetria e topografia ( DEM ), meio ambiente , agricultura de precisão , pesca , epidemiologia , engenharia civil , qualquer mapeamento quantitativo em geral, etc.
Sob um vocabulário diferente, uma variável regionalizada é estritamente equivalente à noção física de campo , e mais precisamente de campo determinístico .
Além da introdução
Neste artigo, e de acordo com os hábitos vocabulares da comunidade geoestatística francófona, o nome genérico de regionalização será utilizado para designar a organização espacial (e / ou temporal) dos fenômenos estudados; por extensão e quando não há ambigüidade possível, essa palavra às vezes designa o próprio fenômeno. Podemos então entender geoestatística como sendo o estudo de regionalizações, em outras palavras, o tratamento de variáveis regionalizadas, "tratamento" significando mais precisamente aqui uma sucessão de quatro estágios:
O ponto de vista do “ Estudo das regionalizações ” tem a vantagem de não privilegiar nem um campo de aplicação (ao contrário da “ geo ”), nem um método (ao contrário das “ -estatísticas ”) e, portanto, corresponde melhor à realidade. Da geoestatística atual. Nesse sentido, e embora historicamente aceitável, a definição proposta por Le Petit Larousse parece ser singularmente restritiva: “ Estimativa de depósitos por métodos estatísticos ”.
Em Estimate and Choose , Matheron apresenta a geoestatística como a prática de "modelos topo-probabilísticos" : uma definição neutra, que também tem a vantagem de apresentar a geoestatística como uma disciplina na junção entre teoria e prática. Mas essa fórmula, embora rigorosamente descritiva, pode ter parecido insistir demais no componente teórico e confundir os praticantes. E, além disso, proposto tardiamente, em última análise, não foi retido pelo uso; pelo contrário, os usuários se acostumaram a simplesmente designar sua especialidade sob o nome coloquial de “geostat”.
Na sua implementação atual, a geoestatística é uma questão de matemática aplicada : embora seja baseada em teorias matemáticas puras ( álgebra linear , espaços de Hilbert , probabilidades posteriores e processos estocásticos ), é principalmente orientada para aplicações concretas., De modo que é confrontada com a realidade física : dados imprecisos ou incompletos, possíveis constrangimentos técnicos ou econômicos, problemas às vezes mal apresentados . É por isso que, ainda em Estimar e Escolher , Matheron não hesita desde o início em descrevê-lo como " um conjunto de modelos, métodos e" truques ", muitas vezes não ortodoxos ". Esta dualidade entre teoria e prática, entre rigor e pragmatismo, é uma constante na abordagem geoestatística aplicada.
Finalmente, embora às vezes possamos encontrar a palavra “geoestatística” na literatura, é historicamente uma palavra singular: citemos, por exemplo, os três volumes do Tratado de Geoestatística Aplicada de Georges Matheron (ver bibliografia), primórdios da literatura geoestatística. Por outro lado, ao mesmo tempo e do mesmo autor, a palavra consagrada em inglês é de fato “ geoestatística ” (cf. Georges Matheron, Principles of geostatistics , Economic Geology vol. 58, 1963).
Em última análise, não se excluiria tratar como VR - por exemplo - valores numéricos atribuídos a pontos de um plano fatorial : neste caso, o objeto estudado não seria mais um fenômeno, mas um artefato puro e simples . - isso aliás, a palavra não tem aqui conotação pejorativa a priori . Nada o proíbe matematicamente; mas a questão seria naturalmente saber que significado atribuir a tal abordagem e, exceto para fazer pesquisa pura, essa questão é obviamente primordial. No campo da geoestatística aplicada, este tipo de operação especulativa, que às vezes pode se revelar muito frutífera, requer extrema cautela metodológica e um grande senso crítico. Por extensão, e quando não há medo de confusão, este termo pode se referir ao próprio fenômeno. No primeiro sentido, a RV é, portanto, um objeto matemático , suscetível como tal a manipulações teóricas; no segundo, é um fenômeno ou um acontecimento físico , mensurável e existente independentemente do observador: essa dualidade é sugerida pelas duas imagens opostas, representando o mesmo território segundo os dois pontos de vista.
A implementação da RV se justifica principalmente para levar em consideração fenômenos que são estruturados e muito irregulares: tais são, por exemplo, na maioria das vezes fenômenos naturais (mineralógicos, geofísicos, meteorológicos, ambientais, etc.), incluindo o comportamento de 'revelam juntos uma organização global no espaço e / ou no tempo, mas cuja variabilidade local proíbe qualquer modelagem por simples expressões matemáticas. Por outro lado, mesmo que teoricamente nada impeça o recurso sistemático ao formalismo da RV, informações completamente desestruturadas poderiam ser processadas com mais vantagem com ferramentas estatísticas ; e, em contraste, fenômenos muito regulares podem ser descritos por funções simples ou equações de evolução .
Esta ferramenta posteriormente encontrou aplicações em campos tão variados como meteorologia e silvicultura , batimetria e topografia ( DEM ), meio ambiente , agricultura de precisão , pesca , epidemiologia , engenharia civil , qualquer mapeamento quantitativo em geral, etc. Assim, sob um vocabulário diferente, uma variável regionalizada é estritamente equivalente à noção física de campo , e mais precisamente de campo determinístico .
Além disso, uma variável regionalizada é fundamentalmente uma variável quantitativa : ela atribui a qualquer ponto do espaço um valor numérico em sentido amplo ( isto é, possivelmente vetorial ou complexo ). Assim, uma variável regionalizada também é um campo no sentido matemático : escalar , ou vetorial , ou campo tensorial : como tal, é provável que seja estudada pelas ferramentas de análise , em particular o cálculo diferencial e o cálculo integral , também como por ferramentas estatísticas .
Para simplificar ... ↑ ↓ | |
Uma variável regionalizada é uma função numérica que, em um determinado domínio geográfico, tem a finalidade de representar um determinado fenômeno físico. O trabalho do geoestatístico consiste em tentar associar as propriedades matemáticas desta função às características estruturais deste fenómeno, de forma a responder aos problemas concretos que dela se colocam (interpolação, estimação, simulações numéricas ...). |
A definição completa de uma variável regionalizada, considerada abstratamente como uma função de um conjunto em outro, requer com todo o rigor especificar a estrutura do conjunto inicial, a estrutura do conjunto final e as propriedades analíticas da função. Mas, na realidade, na maioria dos casos, um RV será simplesmente uma função de um espaço métrico dentro de outro.
Espaço inicialNa medida em que o primeiro objetivo da variável regionalizada é dar conta de uma estrutura espacial, o espaço de trabalho - isto é, o espaço inicial da função VR - deve poder ser equipado, pelo menos localmente , de uma função de distância . Assim, na maioria dos casos, o objeto matemático "espaço inicial" será uma representação abstrata da noção intuitiva de espaço geográfico . Em geral, isso não apresentará nenhuma dificuldade particular: portanto, é fácil medir distâncias em um depósito, em uma terra poluída, em uma floresta, ou medir intervalos de tempo durante o curso de um determinado processo. No entanto, pode-se imaginar situações mais complexas; tão,
No entanto, na prática, o espaço inicial geralmente é simplesmente um espaço euclidiano . Na verdade, é mais exato falar de um subconjunto de tal espaço: na prática, de fato, sempre se trabalha em um domínio limitado , cuja fronteira depende fundamentalmente dos dados disponíveis e do problema colocado. Nessas condições, a mais simples e comum é considerar matematicamente esse domínio de trabalho como um subconjunto limitado de , onde denota a dimensão (espacial e / ou temporal) do espaço de trabalho.
Enquanto o campo de trabalho e a dimensão do espaço são impostos pela natureza do problema a ser resolvido, a escolha da distância é em princípio livre, dentro dos limites frequentemente amplos impostos pela matemática. No entanto, em quase todos os casos, iremos naturalmente preferir a distância euclidiana , se possível , por um lado porque é ela que permite os desenvolvimentos teóricos mais simples, e por outro lado porque corresponde à distância usual medida no campo por praticantes, pelo menos quando apenas as coordenadas espaciais devem ser usadas. Por outro lado, para estudos de natureza espaço-temporal, não é certo que uma resposta puramente matemática seja satisfatória: podemos sempre construir uma distância misturando as coordenadas espaciais e temporais, mas é duvidoso que esta construção por outro lado teoricamente correto tem um significado concreto.
Área de chegadaOs objetos no espaço de chegada são os valores tomados pelo VR em qualquer ponto do espaço de partida.
Caso de um campo escalarSe estivermos trabalhando em um campo escalar, esses objetos serão números, na maioria das vezes reais, de modo que o espaço final será simplesmente . No caso de um VR escalar , a situação é simples de organizar: os valores tomados pelo VR são números que se expressam em unidades da variável estudada. Serão, por exemplo, metros (ou pés ...) se o VR representar altitudes topográficas, metros (ou braças ...) se representar profundidades batimétricas, percentagens (ou g / T ...) se representar teor de minério, etc. E uma vez que o objetivo da geoestatística é essencialmente caracterizar as estruturas espaciais dos objetos estudados, é necessário poder dotar o espaço de chegada de uma ferramenta teórica que permita quantificar a semelhança (ou dissimilaridade) entre dois valores tomados. pelo VR em quaisquer dois pontos da área de trabalho.
Essas ferramentas existem dentro da estrutura de estatísticas usuais; a mais simples é a função de autocorrelação , que permite, entre outras coisas, quantificar a noção intuitiva de “zona de influência”. Esta função tem como argumentos quaisquer dois pontos no espaço geográfico e os associa a um número adimensional entre -1 e +1 que representa o coeficiente de correlação entre os valores da variável considerada nestes dois pontos. Assim, em particular, quando em dois pontos geograficamente distintos corresponde um valor zero desta função, isso significa que não há ligação estatística mútua entre as medições realizadas nestes dois pontos, ou mesmo que o conhecimento do valor obtido pelo VR em um ponto não fornece (estatisticamente) qualquer informação adicional sobre o valor obtido pelo VR no outro ponto. Esta função é, portanto, de grande importância, em primeiro lugar para compreender e modelar a organização espacial da variável de interesse, e depois para a construção de um estimador e, mais particularmente, para a interpolação em cartografia ; e, de fato, pode ser usado em geoestatística, por exemplo, para krigagem simples .
No entanto, a existência teórica da função de autocorrelação requer fortes suposições de estacionariedade que nem sempre são satisfeitas; é por isso que a geoestatística teve que recorrer a outra ferramenta muito cedo. Inicialmente, essa ferramenta é simplesmente a diferença quadrática entre os valores tomados pela variável regionalizada em dois pontos do espaço geográfico. É função de duas variáveis, de forma geral:
ou
Nessas condições, a função aparece como uma medida do contraste existente entre os valores observados em dois pontos. É uma primeira ferramenta para quantificar a estrutura (espacial e / ou temporal) da variável regionalizada, uma função estrutural que, portanto, vai além da simples informação puramente estatística, pois leva em consideração não só os valores tomados pelo VR, mas também também a implantação dos valores observados.
No entanto, considerada dependente de duas variáveis independentes e , esta função não pode ser uma ferramenta operacional, por pelo menos dois motivos:
Desta forma, é imprescindível introduzir hipóteses de trabalho, tanto quanto possível controláveis experimentalmente, que possibilitem modelar a função estrutural respeitando duas restrições antagônicas: dar conta da melhor estruturação da RV, e facilmente constituir um objeto matematicamente manipulável. Esta abordagem (parcialmente mencionada abaixo) constitui a essência do que os geoestatísticos comumente chamam de variografia .
Caso de um vetor ou campo multivariávelO caso em que o conjunto de chegada é multidimensional destaca um problema comum em geoestatística. Matematicamente, de fato, isso não muda quase nada no caso escalar: VR continua sendo uma função em sentido estrito; não é em nenhum caso uma função multiforme , o que também significa que em qualquer ponto do espaço geográfico, ela associa um e apenas um valor no espaço de chegada, mesmo que este seja um vetor, um tensor, ou mais geralmente um multipleto de valores escalares. Em todos os casos, a imagem VR de qualquer ponto no espaço de partida é um único elemento (um singleton ) no espaço de chegada.
Além disso, um exemplo trivial prova que a fronteira teórica entre o caso escalar e o caso multivariável às vezes é muito tênue. Se o espaço de chegada é o plano complexo, pode-se igualmente considerar o VR tomando valores escalares no campo dos complexos, ou tomando seus valores em um espaço bidimensional no campo dos números reais . Nessas condições, e ainda permanecendo no nível teórico, é muito fácil definir uma métrica no espaço de chegada: desta vez definiremos como uma função estrutural.
onde o símbolo designa o módulo do número complexo .
Por extensão, se o espaço de chegada é um espaço vetorial, concretamente se os objetos do espaço de chegada são multipletos de valores que se expressam nas mesmas unidades , podemos naturalmente adotar como função estrutural o quadrado do módulo. Por exemplo, se o VR tem três componentes , e , vamos definir
onde o símbolo denota o módulo do vetor .
Por outro lado, a fórmula anterior não é mais utilizável se os diferentes componentes que constituem o objeto de VR não forem expressos nas mesmas unidades: a soma dos quadrados das diferenças misturaria quantidades heterogêneas e, portanto, não teria mais qualquer significado físico. . Portanto, é necessário definir uma função estrutural ad hoc , que geralmente abre a porta para uma arbitrariedade inevitável. Esta é uma situação que surge quase inevitavelmente quando se trabalha em uma estrutura multivariada: na realidade, não há nenhuma nova dificuldade teórica e os desenvolvimentos matemáticos poderiam ser perseguidos sem obstáculos técnicos; mas a necessidade de impor ao modelo a prestação de contas em boas condições de realidade, pelo contrário, dá origem a complicações muitas vezes consideráveis ao nível da implementação e, nestas condições, a experiência e o sentido de responsabilidade têm muito mais importância do que matemática. rigor para a realização de um estudo aplicado.
Como esses fatores não podem ser incluídos no material de um texto de apresentação geral, discutiremos brevemente as especificidades do caso multivariado mais tarde, embora na prática isso diga respeito à grande maioria dos estudos. Mas não devemos perder de vista que, na prática, o esforço de análise crítica e o diálogo constante com o “cliente” ocupam consideravelmente mais o tempo do geoestatístico do que o domínio das ferramentas teóricas que são mencionadas neste artigo, e que a escolha de uma métrica relevante no espaço de chegada constitui uma das primeiras e mais importantes etapas deste trabalho crítico.
Propriedades analíticas do aplicativoConsiderada como uma função (portanto, um ser matemático), a variável regionalizada pode ser objeto de estudo por todas as ferramentas de análise. Podemos, portanto, questionar sobre seu comportamento assintótico , sua análise harmônica , os possíveis PDEs que ele satisfaz, sua integrabilidade , etc. Claro, exceto no caso de pesquisa puramente teórica, este trabalho deve ser capaz de ser associado a interpretações físicas, razão pela qual modelos muito ricos correm um risco significativo de superinterpretação : estamos tipicamente no contexto de aplicação do princípio de parcimônia . Além disso, mesmo que o modelo e as hipóteses matemáticas sejam corroboradas por observações de campo, deve-se ter em mente que " correlação não implica causalidade ", ou seja, a modelagem estrutural não reivindica qualquer valor explicativo. e mais precisamente ainda, VR como um objeto matemático é limitado a uma descrição de VR como um fenômeno físico. Qualquer busca por uma interpretação, ou mesmo uma explicação, é de responsabilidade exclusiva do usuário.
Nesse sentido, as características de diferenciabilidade da RV constituem um exemplo importante, que é útil detalhar. Para evitar dificuldades técnicas (usando derivadas parciais ou direcionais , problemas estereológicos (in) ), será limitado ao caso elementar as áreas de saída e chegada se identificam com : VR é então simplesmente uma função real uma variável real.
Uma ilustração essencial: a noção de "regularidade"Para uma função real definida em (ou em um subconjunto previamente especificado de ), o conceito de “regularidade” é perfeitamente definido e está associado ao grau de diferenciabilidade da função. Além disso, quando apropriado, esse grau de regularidade só pode ser verificado aos poucos . O conjunto de funções que satisfazem um dado critério de regularidade tem a estrutura de um espaço vetorial , e os vários espaços vetoriais assim determinados satisfazem relações de inclusão estritas que permitem definir com rigor uma hierarquia de caracteres de regularidade. Assim, limitando-se por simplicidade às funções definidas como um todo,
e temos as seguintes inclusões:
o que reflete uma regularidade crescente (no sentido matemático).
Para simplificar ... ↑ ↓ | |
A prática da geoestatística aplicada esbarra na dificuldade real de fazer coincidir conceitos matemáticos precisos com noções empíricas que às vezes são formuladas de maneira incompleta. A dialética é mais acentuada quando as propriedades matemáticas são mais exigentes; e é mais oculto (e, portanto, mais perigoso) quando as noções empíricas em questão parecem bem dominadas ou tidas como certas. Desenvolvimentos puramente teóricos visando apenas a exatidão matemática correm o risco de perder o contato com a realidade e levar ao formalismo puro, correto mas inutilizável. Os desenvolvimentos baseados apenas no pragmatismo correm o risco de escapar às possibilidades de um controle teoricamente rigoroso. > A missão do geoestatístico aplicado é alcançar um equilíbrio, uma síntese aceitável entre essas duas abordagens que, consideradas separadamente, são coerentes, mas incompletas, e que às vezes são difíceis de conciliar. |
Para o geoestatístico aplicado, é essencial saber interpretar essas propriedades em termos físicos. A situação parece simples quando se trata de continuidade ou continuidade fragmentada: a ausência de descontinuidade, ou a restrição de ter apenas um número finito de descontinuidades, parecem ser propriedades efetivamente observáveis no campo, acessíveis experimentalmente. E, no entanto, já estamos diante de uma forma discreta de “ ruptura epistemológica ”. Porque, ao contrário de sua versão matemática, a continuidade na verdade não é claramente definida de acordo com o senso comum . Para ilustrar essa afirmação, podemos pensar em um exemplo muito simples de RV: topografia. Dizer que em um território a altitude é contínua, isso significaria que não há descontinuidade em lugar nenhum, que não há ponto de salto repentino de altitude. Mas essa afirmação é sensata se os dados observados estiverem separados por alguns centímetros, quanto mais se descermos a escalas microscópicas? de fato, experimentalmente, o próprio conceito de "continuidade" guarda algum significado? mesmo, indo até o paradoxo, pode haver continuidade na escala atômica? além disso, ainda é relevante falar apenas de "altitude" abaixo de certas dimensões da observação?
A origem deste hiato é claramente identificada: o conceito matemático de continuidade, rigoroso, é uma noção infinitesimal e, além disso, VR é uma “variável pontual”. Por outro lado, "continuidade" de acordo com o senso comum e, a fortiori, "regularidade", são noções vagas que se baseiam sempre (embora implicitamente) em uma escala de observação e trabalho. No entanto, esse fator de escala está essencialmente ausente do formalismo matemático. O papel fundamental do geoestatístico (e de qualquer modelador ) é, então, reunir os dois pontos de vista: especificar noções que são muito vagas do ponto de vista naturalista, para poder expressá-las em termos rigorosos; e ao mesmo tempo iluminar ao máximo os pressupostos matemáticos exigidos, para lhes permitir descrever a realidade "em boas condições" - entendendo-se que o grau de adequação do modelo à realidade é um parâmetro ajustável, que procede geralmente a diálogo entre o geoestatístico e seu cliente.
Nesse sentido, a ambivalência da expressão “variável regionalizada” é prejudicial aqui. De fato (tendo em mente, a título de ilustração, o exemplo da topografia),
Resumo: realidade e modelos ↑ ↓ | |
Existe apenas uma realidade (física); entretanto, existem tantos modelos (matemáticos) quantos o usuário desejar. A realidade se impõe ao usuário; sujeito à precisão matemática, o usuário é a priori um mestre de seus modelos. Um modelo não é "certo" ou "errado": é eficaz ou não, útil ou não, judicioso ou não. E isso é verdade mesmo para os modelos mais básicos, como a variável regionalizada. Nessas condições, não existe um "modelo real": o trabalho do modelador, e do geoestatístico em particular, não é encontrar uma verdade que estaria oculta por trás de dados brutos, mas construir sob sua responsabilidade um objeto matemático que irá ser um intérprete que respeita a realidade (“ restrição a montante ”) e uma ferramenta eficaz para responder às perguntas feitas (“ restrição a jusante ”). |
Em estudo, as características estruturais não são atributos inequívocos da RV física, mas apenas propriedades do modelo adotado aqui e agora ; mas nada proíbe propor modelos diferentes para o mesmo fenômeno. Enquanto a realidade se impõe a nós, ao mesmo tempo somos os únicos mestres (obviamente dentro dos limites do bom senso e do rigor matemático) de nossas escolhas intelectuais para modelá-la. Um assunto para meditação ...
Naturalmente, essas dificuldades metodológicas aumentam quando o conceito matemático em questão se torna mais exigente. As observações talvez inesperadas que acabaram de ser feitas sobre a RV (topografia, no exemplo) se tornariam, por exemplo, mais cruciais se olharmos para a derivada da RV. Assim, uma função matemática é, ou não, diferenciável em um domínio; mas que significado dar à “derivada” - uma noção irremediavelmente infinitesimal - de um fenômeno físico, aliás na maioria das vezes reconhecido apenas em uma amostra finita? Quanto ao conceito de "regularidade", é ainda mais perigoso de manipular, pois em matéria de função matemática significa "infinitamente diferenciável", ao passo que, apesar de sua aparência intuitiva, simplesmente não tem uma definição unívoca. fenômeno: um rio que faz muitos meandros tem um curso regular como um pescador o afirma de seu barco no meio da água, ou, ao contrário, quase caótico como afirma um cosmonauta que sobrevoa algumas centenas de quilômetros? .. Não existe uma resposta universal.
“ O modelo nunca é idêntico à realidade. Inúmeros aspectos da realidade sempre lhe escapam e, ao contrário, o modelo sempre contém inúmeras proposições parasitas, sem nenhuma contrapartida na realidade. "
Agora, em seu sentido matemático de função, " a variável regionalizada não é idêntica à realidade, mas ela mesma já constitui um modelo primário ". Essencial para o desenvolvimento posterior de um estudo geoestatístico, a definição deste primeiro modelo é admitidamente não muito problemática, mas permite uma implementação rigorosa do referencial teórico e, possivelmente, chama a atenção para as dificuldades envolvidas. A título de ilustração, os exemplos a seguir apresentam algumas questões que podem surgir a partir desta primeira etapa.
TopografiaUma primeira ilustração já mencionada, muito simples, pode ser dada pela topografia de um determinado território geográfico . Em qualquer ponto coordenado deste território, o valor da altitude pode ser considerado como o resultado de uma aplicação do domínio geográfico no conjunto de reais.
Mesmo que pareça natural, o próprio fato de representar a topografia por um VR (portanto: uma função ) implica uma suposição: que o relevo não apresenta consolo. Nesse caso, essa não é uma restrição muito importante, mas essa observação mostra que a etapa de modelagem mais inofensiva já pode incluir suposições. Na medida em que o desenvolvimento de um modelo não é um fim em si mesmo, mas apenas constitui a instalação de uma ferramenta destinada a responder a questões concretas, é bom nunca perder de vista essa propriedade. Essencial, para que os desenvolvimentos teóricos subsequentes não se desviem sub-repticiamente da realidade. Neste caso específico, haveria dificuldade em traçar curvas de nível (por exemplo, para um mapa de equipe) se houvesse áreas do domínio mapeado onde a variável de topografia pode apresentar dois valores distintos no mesmo ponto.: Uma situação certamente muito raro, mas não totalmente impossível em certos relevos particulares (certas montanhas, penhascos, desfiladeiros ...).
Se a topografia pode de fato ser modelada por um VR, a propriedade de continuidade do modelo será escrita :, já que desta vez o espaço geográfico é , um subconjunto de . Esta propriedade está associada intuitivamente à ideia de um mapa cujas curvas de nível não apresentam anomalias (sem descontinuidade e sem zona de acumulação). Talvez de significado físico mais claro, a propriedade de continuidade por partes, que será escrita :, significa que há apenas um número finito de penhascos verticais no domínio. E da mesma forma, a diferenciabilidade por partes - - poderia ser interpretada como a presença de um número finito de arestas vivas (quebras na encosta: cristas ou sulcos) no domínio.
Mas, naturalmente, essas diferentes características intuitivas (sem descontinuidades, sem penhascos, sem quebra de declive - ou apenas em número finito) só têm um significado prático quando associadas a uma determinada escala de observação, e esse fator de escala está ausente do formalismo matemático : o VR “não conhece” as condições em que os valores numéricos dos dados foram adquiridos. Cabe ao usuário e somente a ele integrar essas informações adicionais na interpretação dos resultados produzidos por um algoritmo que não foi capaz de levá-los em consideração.
MeteorologiaNo mesmo território de antes, também podemos nos interessar por parâmetros meteorológicos medidos a uma distância fixa do solo. Um ponto do domínio estudado é, portanto, este tempo identificado por três coordenadas (por exemplo, latitude, longitude e altitude), de forma que o espaço inicial é tridimensional. Observe que a altitude , que foi a variável de interesse no exemplo anterior (portanto, pertencia ao espaço de chegada), desta vez tem o estado de uma coordenada. Suponhamos então que se esteja interessado em todos os pontos com os respectivos valores da temperatura (escalar) e da componente horizontal do vento (vetor bidimensional). VR (anotado para a ocasião) será, portanto, um aplicativo:
Este exemplo pede alguns comentários:
Por ocasião deste exemplo meteorológico, podemos evocar outro problema. Suponha que o primeiro componente do domínio de chegada mede a altura geopotencial para um valor da pressão atmosférica, e que o domínio horizontal de estudo está localizado em uma área geográfica que permite a aproximação geostrófica . O domínio de definição deste novo VR é, portanto, a forma . Os três componentes de :
são, em virtude desta aproximação, relacionados (a fixos) por um sistema PDE :
onde é uma constante ( fixa) se o domínio não for muito grande.
Assim, matematicamente, o vento geostrófico é caracterizado pelo geopotencial, ou ainda: os dois últimos componentes do VR são caracterizados pelo primeiro. Esta é apenas uma simplificação, mas este exemplo ilustra que pode haver não apenas links estatísticos, mas até mesmo links funcionais entre os componentes de um VR. Esta é a oportunidade de sublinhar mais uma vez a diferença entre os pontos de vista matemático e físico.
Para simplificar ... ↑ ↓ | |
Os resultados de operações infinitesimais, como a derivação, não podem, por natureza, ser medidos , em qualquer caso, com base em um conjunto finito de dados sobre os quais essas operações atuam. Só podemos obter valores estimados , portanto produzidos por meio de construções intelectuais dependendo de escolhas metodológicas arbitrárias. É essencial nunca confundir
|
Na verdade, pode-se acreditar que a aproximação geostrófica pode dispensar a realização de medições de vento. Pode-se pensar também que essas equações permitem, com as únicas medições do vento, verificar a hipótese geostrófica já que se deve ter em virtude do teorema de Schwarz :
.No entanto, na prática, não é. Sendo os dados necessariamente em número finito, não é estritamente possível medir os componentes do vento derivando nas duas direções principais os valores do geopotencial, assim como não é possível medir as derivadas parciais dos componentes de o vento - novamente porque a derivação é uma operação essencialmente infinitesimal, o que é fundamentalmente impraticável com um conjunto finito de valores.
No máximo, podem-se propor algoritmos de estimação , por exemplo do vento do geopotencial, usando as equações teóricas fornecidas pela física. Também podemos realizar outras manipulações com base nos três componentes da RV e levando em conta a equação teórica que conecta esses três componentes: esta abordagem é um dos fundamentos da geoestatística multivariável (cf. bibliografia: H. Wackernagel, 2003). Mas por mais interessantes que os resultados assim obtidos possam ser, é essencial ter em mente que se trata de artefatos , produtos resultantes de um algoritmo, e não dados brutos. Eles são imagens da realidade, não medidas da realidade.
PoluiçãoImaginemos como exemplo final que o fenômeno a ser estudado é a poluição de um rio por determinado poluente . Levando em consideração a variável estudada, parece judicioso não utilizar a distância euclidiana, principalmente se o rio faz muitos meandros: é muito preferível contar as distâncias seguindo o curso do rio, pois é o curso que segue o poluente. . Para simplificar o exemplo, não levaremos em consideração as variações na poluição ao longo da largura do rio e assumiremos que a seção estudada não inclui afluentes: nessas condições, é natural localizar espacialmente uma medição, mas não sua a abscissa curvilínea é ainda, mais concretamente, pela distância até um ponto de referência ao seguir o curso do rio. Nessas condições, e assumindo que a medida de poluição é um escalar, o VR é uma aplicação simples de em :
Não há dificuldade em relação à localização geográfica, e o espaço inicial pode, de fato, ser fornecido com uma métrica. Porém, a natureza da variável estudada não pode ser satisfeita com uma única informação de distância; quando dois pontos são comparados, a medição da diferença entre eles é uma informação bastante pobre: em particular, não é irrelevante saber qual dos dois pontos está a montante e qual está a jusante. Esta informação não pode ser tida em conta por uma distância, que é por natureza uma função simétrica dos dois pontos aos quais se aplica.
Antecipando os métodos de geoestatística multivariável, podemos sugerir adicionar a abscissa curvilínea como uma variável adicional, e considerar o estudo das variáveis em conjunto e com as ferramentas adequadas para o trabalho multidimensional: por exemplo, estudar a nuvem de correlação entre e tentar destacar uma deriva (tendência). Além disso, é muito provável que a estrutura local da poluição também dependa da velocidade da corrente: podemos, portanto, adicionar também esses dados, ou melhor, o que será sem dúvida mais simples, a altitude que provavelmente constituirá uma boa variável explicativa. . Nessas condições, VR aparecerá como um aplicativo:
Podemos também, se os dados permitirem, escolher outro ângulo de ataque e envolver o fator tempo e a velocidade de propagação do poluente ao longo do rio, portanto o fluxo ...
Esta reflexão sumária sublinha o interesse que pode haver em solicitar variáveis auxiliares que, sem apresentarem real interesse por si mesmas, possam ajudar a refinar o conhecimento estrutural da variável de interesse, permitindo continuar a beneficiar ferramentas geoestatísticas gerais. Naturalmente, o acréscimo de novas variáveis introduz o problema, já encontrado, da escolha de uma métrica no espaço de chegada ... Mais uma vez, a responsabilidade do geoestatístico é decisiva para a relevância e eficiência dos desenvolvimentos do modelo.
Um lembrete importante: ↑ ↓ | |
A abordagem do geoestatístico aplicado é constantemente pautada - o que significa: constrangimento, mas também garantida - pelo respeito ao princípio já encontrado e assim afirmado por Matheron: “ O modelo nunca é idêntico à realidade. Inúmeros aspectos da realidade sempre lhe escapam e, ao contrário, o modelo sempre contém inúmeras proposições parasitas, sem nenhuma contrapartida na realidade. " |
Os comentários que até agora marcaram o estabelecimento do conceito de RV, assim como os poucos exemplos elementares propostos, constituem uma ilustração do aforismo de Alfred Korzybski : " um mapa não é o território ". A " ruptura epistemológica " de fato já está em ação, e deve-se ter em mente se, como é comum, o vocabulário variável regionalizado é usado para designar o fenômeno e a função matemática que está envolvida. Os modelos : a função VR é não o fenômeno VR.
No exame, essa advertência na verdade parece ser senso comum. Voltando ao vento geostrófico, por exemplo, as equações expressam que o vetor (objeto matemático) é o gradiente (operação matemática) da altura geopotencial (objeto matemático) sob o pressuposto de equilíbrio geostrófico. Mas que significado teria para declarar: "equilíbrio geostrófico é quando o vento (fenômeno físico) é o gradiente (noção física indefinida) da altura geopotencial (dados físicos)"? A formulação correta, que explicaria rigorosamente a relação entre fenômeno e modelo, seria: "diremos (por definição) que existe equilíbrio geostrófico quando o vetor adotado para modelar o vento pode ser considerado como o gradiente da função adotada para modelar a altura geopotencial ”. E, aliás, esta formulação também tem o mérito de enfatizar que o “equilíbrio geostrófico” é uma propriedade do modelo, e não um fenômeno físico observável independente do observador; de fato, essa formulação constitui exatamente uma definição , expressa com rigor, do conceito matemático de "equilíbrio geostrófico".
Claro, tal declaração purista é muito pesada e nunca é encontrada em publicações; os riscos de acidentes metodológicos são, de fato, bastante limitados. De modo que, por exemplo, no uso geoestatístico, a expressão variável regionalizada é, dependendo do contexto, utilizada em um ou outro de seus significados.
Mas para evitar possíveis mal-entendidos, o leitor deve ter em mente a frase de Korzybski. Esta é também a ocasião para observar que este aforismo levanta implicitamente três pontos importantes:
Mapa e território: além do julgamento de valorClaro, o mapa não é o território, mas essa distinção não deve encorajar uma classificação, um julgamento de valor ou uma hierarquia. Seria errado querer afirmar qualquer "superioridade" do mapa sobre o território (ou o contrário). Cientificamente, não faz sentido expressar uma "preferência" entre a realidade e o modelo: esses dois objetos são essencialmente de natureza diferente e, como tal, não podem ser classificados. Seus status epistemológicos são diferentes, seus papéis no curso de um estudo são diferentes: a realidade existe independentemente de nossas escolhas pessoais e nos é imposta; o modelo é nossa criação e devemos dominá-lo.
Mas, ao mesmo tempo, assim que nos dedicamos à geoestatística aplicada , o desenvolvimento de um modelo não é um fim em si mesmo, e se destina a dar conta da realidade. Por isso, é importante associar a cada modelo um critério que permita avaliar, se possível quantitativamente, a adequação desse modelo à realidade. E essa noção de adequação, que deve ser definida a priori , é claramente contingente e dependente do problema a ser resolvido: todas as outras coisas sendo iguais (campo estudado, dados disponíveis, restrições computacionais, etc.), uma dada modelagem não terá não a mesma relevância dependendo da pergunta feita: assim, seria bastante ilusório esperar alcançar uma ferramenta universal para avaliar modelos. Pelo contrário, um critério é necessariamente convencional , e sua caracterização está intimamente ligada à escolha já encontrada na definição de uma métrica: uma escolha que, portanto, inclui uma parte importante e inevitável da arbitrariedade - esta palavra, mais uma vez, não tendo conotações negativas. Em teoria, portanto, há grande liberdade na escolha dos critérios, mesmo que razões muito diversas (culturais, considerações de facilidade de implementação, ou mesmo a moda corrente na comunidade científica, etc.) possam limitar essas escolhas; também é prudente se ater ao princípio da parcimônia .
Para simplificar ... ↑ ↓ | |
A realidade (o território) existe independentemente do observador e só pode ser apreendida intelectualmente por intermédio de uma conceituação. A variável regionalizada, o modelo primário , é o primeiro passo nesta conceituação e, por construção, constitui a melhor representação numérica possível da realidade. Mas, por um lado, sua complexidade não permite um processamento matemático simples; e por outro lado, só é acessível em um número finito de itens de dados. Portanto, só pode servir de base para modelos mais abstratos, menos fiéis à realidade, mas escolhidos para serem manipulados por ferramentas matemáticas. Em particular, estes novos modelos poderiam, por comparação com o VR agora tomado como referência, ser objecto de uma avaliação desde que previamente definido um critério de qualidade. Como não pode haver uma medida universal da qualidade de um modelo, o usuário tem uma margem de manobra muito grande para concordar com esse critério: ele deve, portanto, ser particularmente realista e eficiente. |
É importante notar a este respeito que VR (função) geralmente não obedece a este princípio. Na verdade, tendo em cada ponto vocação para tomar um valor que seria exatamente o que se pudesse medir no terreno, o VR é de uma complexidade incrível, e não pode ser explicado por uma expressão matemática simples e utilizável. Certamente poderíamos considerar que a função VR descreve o fenômeno VR de uma forma ótima ou mesmo perfeita, mas essa perfeição é estéril, porque não opera: estamos condenados a manipulações puramente tautológicas . Assim, de forma essencial, o modelo primário acaba sendo na maioria das vezes inoperante como tal, e é por isso que a geoestatística tem se voltado para modelos mais elaborados, de natureza probabilística (ver parágrafo 3 deste artigo). Assim, voltando ao aforismo de Korzybski, podemos enriquecê-lo insistindo: "nenhum mapa é o território " e, além disso, o único que poderia pretender dar conta da realidade, exatamente e apontar a ponto, é geralmente impraticável.
Dito isto, para qualquer tratamento numérico de um dado fenômeno, a variável regionalizada constitui a informação quantitativa irredutível mais fundamental, a base sobre a qual todos os modelos posteriores podem ser desenvolvidos, a referência suprema à qual devemos retornar em caso de dificuldade. Esse papel básico levou Matheron a introduzir a noção muito importante de magnitude regional: “ Chamamos magnitude regional, ou simplesmente regional , qualquer funcional da variável regionalizada definida em , ou seja, qualquer magnitude cujo valor seja determinado pelos dados de todos. os valores numéricos quando itera . »Consequentemente, para evitar o risco de um hiato entre os desenvolvimentos teóricos e o problema real que se pretende resolver, é necessário garantir que as afirmações dos resultados possam ser formuladas em termos de magnitudes regionais para sair, pelo menos em teoria, uma possibilidade de controle a posteriori .
É preciso também estar ciente de que essas restrições metodológicas são virtuais , e não podem ser atuais se o campo de trabalho for um continuum , uma vez que não é possível realizar uma infinidade de medições incontáveis. No máximo, pode-se (imaginar) realizar as medições em um conjunto finito de pontos não especificados designados no espaço. A dificuldade aqui não é conceitual, mas apenas técnica, e é semelhante a um problema clássico encontrado, por exemplo, na amostragem ; assim, uma grandeza regional, se não se limitar a uma combinação finita de valores pontuais do VR, nunca pode ser medida em sentido estrito, mas sempre podemos propor uma aproximação : será apenas uma questão de coleta de informações.
Comparação de diferentes modelosUma vez acordado um critério de avaliação, nada impede a comparação de diferentes modelos entre si para expressar preferências. Pode ser uma dicotomia simples: modelos aceitáveis vs. modelos a serem rejeitados. Mas se for um critério numérico, podemos ir mais longe e classificar os modelos testados: geralmente consideraremos que um modelo é tanto melhor quanto sua distância do VR é menor. Assim, embora não tenha sentido estabelecer um juízo de valor comparativo entre o modelo e a realidade, é, pelo contrário, possível - e desejável - procurar estabelecer uma hierarquia entre os modelos. Mas essa hierarquia é, obviamente, fundamentalmente dependente do critério adotado e, portanto, tem um grau significativo de arbitrariedade.
Por exemplo, se tomarmos como critério uma função da única distância do modelo ao VR, o melhor modelo possível será pela construção do próprio VR (função); mas essa resposta obviamente não será satisfatória, visto que é um objeto matemático impossível de explicar e manusear. Por outro lado, nada impede, por exemplo, de modelar a totalidade de um fenômeno em um determinado domínio pela média aritmética dos dados do VR medidos neste domínio: dificilmente se pode imaginar mais simples, mas se perde todas as informações estruturais sobre o fenômeno, resumindo toda a sua complexidade por um único número ...
Dois pontos de vista opostos e complementares se unem nesta busca de um critério de qualidade, dependendo da prioridade que nos atribuímos:
Mais uma vez, não há escolha “verdadeira” ou “falsa” quando se trata de escolher entre restrições upstream e downstream. Existem escolhas judiciosas ou não, eficazes ou não, dependendo das questões que queremos resolver, dos meios disponíveis, dos constrangimentos económicos, etc. E o rigor metodológico exige não reajustar, de forma ad hoc e a posteriori , um critério de qualidade de acordo com a conclusão que se deseja promover.
Área de validade do modeloPara manter as coisas simples e coloridas ... ↑ ↓ | |
Por natureza, um modelo sempre busca viver uma vida matemática autônoma e, sendo uma construção intelectual, produzir resultados que são essencialmente artefatos puros . Contanto que não faça nada além de se libertar do controle do usuário, isso não é necessariamente prejudicial e pode até ser frutífero. Deixar o modelo com um pouco de freio no pescoço às vezes abre caminhos interessantes de investigação, a serem explorados naturalmente com cautela, mente analítica e senso crítico. Por outro lado, quando o modelo se liberta completamente da referência à realidade, saímos do campo das ciências aplicadas e nos encontramos (na melhor das hipóteses) em um quadro puramente acadêmico: portanto, tomando as afirmações de um O modelo que se tornou independente constituiria o erro metodológico mais grave, uma transgressão do limiar do realismo . |
Ainda para ficar na terminologia de Korzybski, a questão é finalmente saber o que acontece com o mapa além do território. Em outras palavras, isso coloca o problema da extrapolação . Na verdade, o território estudado (fisicamente) é necessariamente delimitado, enquanto os modelos (matemáticos) usados muitas vezes têm um domínio de validade ilimitado. Ora, sem sequer ir tão longe a ponto de falar sobre comportamentos assintóticos , que significado podemos atribuir a uma afirmação do modelo relativa a porções de espaço distantes dos dados disponíveis? Ou ainda: que confiança podemos depositar em “o que nos dirá” um modelo fora do domínio ao qual foi ajustado? A questão não é acadêmica: por exemplo, as previsões meteorológicas ou econômicas são essencialmente interessantes para o futuro, ou seja, para um intervalo de tempo em que por natureza não há informações disponíveis para corroborar ou confirmar. ' Inverter o modelo ...
Isso é inelutável: quando o modelo é solicitado em áreas do espaço ou do tempo onde não poderia ser controlado, ou quando invoca propriedades matemáticas que não poderiam ser associadas a particularidades físicas, inevitavelmente corremos o risco de que desenvolvimentos teóricos, doravante privados do controle de dados medidos em campo, oferecem resultados desprovidos de qualquer probabilidade, até mesmo absurdos. A razão desse perigo é fácil de entender: a adoção de um modelo, de fato, sempre constitui uma hipótese antecipatória , pois, de acordo com uma citação já encontrada, “ ... o modelo sempre contém inúmeras proposições parasitas, sem contrapartida. Nenhuma em realidade. " O aparente paradoxo é que a introdução de tal hipótese antecipatória, embora fonte de perigos e incertezas, é ao mesmo tempo essencial: é ela que permite sair das manipulações tautológicas sobre os acúmulos de valores. Digital, e produzir resultados inteligíveis e operativos.
Em resumo, dois riscos de ultrapassar o " limiar do realismo ", surgem dois tipos de extrapolações :
Esses dois tipos de extrapolação não são condenáveis em si mesmos e, às vezes, são até essenciais. Mas aumentam o risco de que os desenvolvimentos metodológicos e suas conclusões se desviem inaceitavelmente da realidade, o risco de cometer um erro radical . Um risco inevitável, muitas vezes fecundo, e inerente a qualquer processo de representação teórica da realidade; cabe ao praticante aproveitar ao máximo seu senso crítico e sua experiência para minimizar esse risco, sob sua responsabilidade.
Uma ilustração em um caso simplesA fim de ilustrar a abordagem crítica exposta acima, propomos aqui um exemplo unidimensional simplificado, construído para a ocasião. Pode-se pensar, por exemplo, em um perfil topográfico descrevendo um relevo na beira do mar (os valores de altitude são negativos em uma das bordas do domínio: podem ser interpretados como profundidades batimétricas). Para fixar ideias, podemos supor que as unidades nos dois eixos são hectômetros.
Esta é uma construção acadêmica, uma vez que a totalidade da variável regionalizada foi aqui construída por um algoritmo matemático, portanto, poderia ser efetivamente conhecida. É representado no lado oposto pelo perfil em azul claro.
Esta situação é, estritamente falando, completamente irrealista quando se trabalha em medidas físicas experimentais, uma vez que não é possível acessar o conhecimento efetivo de um continuum de valores estritamente pontuais . No entanto, com uma aproximação que pode ser considerada aceitável, este conhecimento exaustivo de VR poderia ser considerado como tendo sido alcançado em alguns casos particulares, em sensoriamento remoto por exemplo: é possível admitir que uma imagem de satélite forneça informações exaustivas de um físico fenômeno.
No entanto, na grande maioria dos casos, a realidade só é medida numericamente por um número finito de dados pontuais, que geralmente são pequenos. Este estado de coisas levanta o problema muito importante da amostragem e, em particular, a questão da representatividade das amostras: o valor de um conjunto de dados não depende apenas da quantidade de informação disponível, mas também da sua qualidade, isto é designadamente, da organização geográfica do seu estabelecimento.
No exemplo examinado aqui, presume-se que haja apenas oito itens de dados distribuídos irregularmente, representados por pontos amarelos. Assim, se nos limitarmos a dados numéricos, os oito valores de altitude (e as oito coordenadas correspondentes) associados a esses oito pontos constituem a única informação disponível.
Metodologicamente, a implementação deste exemplo acadêmico é evidente: colocamo-nos no ambiente de um estudo real, ou seja, apenas nos permitimos usar as oito medidas pontuais designadas; mas podemos comparar a posteriori as construções realizadas e a realidade da curva azul. Esta situação extremamente privilegiada obviamente não é possível na realidade, onde VR só é acessível na prática por um conjunto finito de medições. No campo, o único controle possível consiste em realizar medições adicionais em pontos onde inicialmente não havia dados disponíveis e comparar seu valor com o que os algoritmos desenvolvidos com base nos dados iniciais propõem.
Mapa e território: além do julgamento de valorO objetivo do painel abaixo é apenas tornar visível a diferença fundamental na natureza que separa o “mapa” do “território”, e ilustrar a frase já mencionada: “ O modelo nunca é idêntico à realidade. Inúmeros aspectos da realidade sempre lhe escapam e, ao contrário, o modelo sempre contém inúmeras proposições parasitas, sem nenhuma contrapartida na realidade. "
Esterel, à beira-mar.
Baía de Hawke, Nova Zelândia.
Assista Hill, Rhode Island.
Foz do rio Sado.
Ilha de Marion, África do Sul.
Baía de Erebus, Antártica.
Éze, Alpes-Maritimes.
As diferentes paisagens oferecidas são todas, ao custo possível de uma mudança de coordenadas, compatíveis com o perfil do VR e, a fortiori, com os oito dados disponíveis. Sua variedade destaca tudo o que o estágio de modelagem perde no nível do conhecimento bruto de um fenômeno, e isso no nível do modelo primário . Mas, inversamente, a função matemática da RV permite construções intelectuais que permitirão ir além da simples acumulação de dados digitais, e propor sínteses que ajudem a enriquecer esta fase do conhecimento bruto e propor esquemas de compreensão do fenômeno. Assim, fenômeno e modelo têm papéis essencialmente complementares, e a tarefa do geoestatístico é garantir essa complementaridade ao longo de um estudo.
No entanto, no contexto de um estudo aplicado , nem é preciso dizer que em caso de desacordo entre os desenvolvimentos do modelo e as observações de controle a posteriori , é o modelo que deve ser corrigido: o modelo se destina a representar o real. , enquanto o último não tem que cumprir com nossas representações intelectuais. É essa assimetria que torna toda a eficácia da abordagem científica, e é o domínio operacional dessa assimetria que caracteriza o valor de um praticante.
Comparação de diferentes modelosAlém do perfil do VR e dos oito pontos de dados, a animação ao lado mostra seis modelos possíveis para representar o fenômeno.
Foi escolhido aqui para oferecer apenas modelos que respeitem os dados, ou seja, que restaurem exatamente o valor dos dados nos pontos onde as medições foram feitas: assim, o VR como os seis modelos passa exatamente pelos oito pontos de dados. Essa restrição parece senso comum, mas não é de forma alguma obrigatória: pode-se, por exemplo, imaginar que as medições estão contaminadas com erros e que, conseqüentemente, não é judicioso tentar com toda a força restaurar com o modelo o valor exibido pelo equipamento de medição. Além disso, os dispositivos de medição são normalmente acompanhados de especificações técnicas que fornecem, em particular, o seu grau de precisão, sendo esta informação crucial um elemento importante para orientar o utilizador na definição de um critério de qualidade para os seus modelos.
Portanto, parece intuitivo que, se optarmos por respeitar os dados, as diferentes representações possíveis da realidade serão tanto mais semelhantes quanto haverá muitos dados, uma vez que todas essas curvas serão forçadas a percorrer os mesmos pontos: este é um efeito tradicionalmente denominado> condicionamento em geoestatística, e o condicionamento pelos dados constitui de certa forma uma força de evocação que força os modelos a não se afastarem muito da realidade.
Essa intuição deve, entretanto, ser considerada com cautela; vamos imaginar que o VR deste exemplo foi reconhecido por 201 pontos: sua modelagem por um polinômio de grau 200 teria sido de enorme instabilidade numérica de acordo com as coordenadas desses pontos, longe da aparência geral do VR apesar de condicionamento muito forte . No que diz respeito ao condicionamento por oito pontos, é pelo contrário muito frouxo, podendo -se esperar a priori modelos não apenas diferentes quanto às suas texturas (características morfológicas do detalhe), mas também quanto aos seus ritmos gerais.
Podemos esperar de um modelo, supostamente para refletir a realidade, pelo menos três tipos de propriedades:
Para simplificar ... ↑ ↓ | |
Podemos legitimamente pedir a um modelo que seja belo, ou preciso, ou que se assemelhe à realidade, com a única condição de termos definido com precisão o significado dado a esses três conceitos. Por outro lado, seria ilusório esperar que um modelo satisfizesse simultaneamente essas três restrições. Mais uma vez, cabe ao praticante resolver isso e encontrar o equilíbrio certo entre o que é possível e o que é desejável: seu objetivo não é encontrar um "modelo real" hipotético, mas escolher o modelo que melhor atender às suas expectativas. |
Cada um desses requisitos tem sua legitimidade e seu grau de desejabilidade. Mas é claro, o praticante deve escolher, e ele não pode esperar de um único modelo que essas três restrições sejam simultaneamente satisfeitas de forma otimizada: por exemplo, "assemelhar-se à realidade" e simultaneamente "ser regular" não poderia ser satisfeita. Considerou que se a realidade eram de fato regulares, o que não tem nada de geral sobre as variáveis naturais; ou ainda, a "precisão" de um modelo não implica de forma alguma que ele deva "se assemelhar" à realidade. A figura acima ilustra brevemente essas reflexões:
Esses exemplos poderiam ser multiplicados ad infinitum: cabe ao praticante, e somente a ele, resolver, porque os dados por si só não permitem fazer uma escolha inequívoca. Além disso, deve ser lembrado que quase sempre, VR é apenas parcialmente reconhecido por amostragem necessariamente limitada, de modo que as "restrições a montante" não só não podem ser satisfeitas, mas só podem ser definidas por referência não ao próprio VR, mas para a ideia do praticante disso. Isso é particularmente verdadeiro para a textura da RV, ou seja, seu comportamento de detalhes, que é por natureza inacessível experimentalmente; é por isso que o esforço de modelagem deve ser auxiliado por um diálogo permanente com os naturalistas (dependendo do caso, geólogos, geofísicos, meteorologistas, economistas, etc.), que são os únicos a fornecer essas informações adicionais ausentes dos dados e ainda essenciais. Uma das peculiaridades da abordagem geoestatística é trazer imediatamente à luz esse problema que, de fato, diz respeito a toda a matemática aplicada.
Área de validade do modeloEsta rápida animação ilustra como o efeito condicionante é exercido nas diferentes representações que podemos ter da realidade. Como era previsível, os valores do "mapa" são os mais fortemente restringidos perto de um datum e, inversamente , os modelos podem propor valores extremamente diferentes quando se afasta de qualquer ponto de medição: isso é muito claro sobre a extrapolação, aqui por exemplo para valores de abcissas menores que 30 ou maiores que 470 hm . Mas pode-se notar que essas flutuações numéricas muito importantes podem aparecer até mesmo na interpolação, de acordo com a densidade dos dados de condicionamento ou suas disposições relativas: é o que acontece, por exemplo, com a abscissa 430 hm , que no entanto poderia parecer perto o suficiente de um ponto de dados. Por outro lado, a agregação de três dados entre as abscissas 320 e 360 hm provoca um condicionamento muito forte, de forma que todas as cartas quaisquer que sejam apresentem valores muito semelhantes neste intervalo.
O propósito de "congelar quadros" é enfatizar que este efeito de condicionamento ocorre independentemente dos modelos adotados para desenhar o perfil, ou seja, em particular qualquer que seja a aparência geral e a textura dos mapas. No entanto, podemos notar neste exemplo um fenômeno frequentemente observado empiricamente: são os modelos matematicamente mais regulares (indefinidamente diferenciáveis, neste caso) que causam as flutuações numéricas mais consideráveis e, pode-se supor, as menos realistas. Em outras palavras, e para usar termos antropocêntricos, um modelo muito regular é menos facilmente restringido pela realidade e busca se impor com mais força ao usuário.
Como uma primeira conclusão, destacamos, portanto, os riscos envolvidos no que se denomina “extrapolação física”, e demonstramos que esse risco pode ocorrer mesmo dentro do domínio amostrado, dependendo da configuração geométrica dos dados.
Mas este exemplo muito simples também ajuda a ilustrar os perigos da “extrapolação metodológica”.
Assim, como os modelos aqui propostos são todos pelo menos deriváveis, pode-se questionar o significado que sua derivada poderia assumir. Mesmo que não tenha um significado claramente definido para falar de derivada de um fenômeno, pode-se supor que a derivada do modelo (que por suposição existe matematicamente) dá um vislumbre plausível de uma inclinação média do VR, em um sentido que deve ser esclarecido. A figura ao lado mostra o quão arriscada é essa hipótese. Trata-se de um zoom realizado em torno do último ponto de dado da figura anterior, e que mostra que podem haver diferenças consideráveis ao nível das inclinações dos diversos "mapas", inclusive se um estiver localizado exatamente em um ponto de dados. . Na verdade, ao querer interpretar a derivada do mapa, invocamos uma propriedade analítica do modelo que vai muito além da estrutura na qual o modelo foi realmente ajustado.
Naturalmente, os riscos de transgredir o limiar do realismo serão aumentados se solicitarmos uma propriedade ainda mais exigente: se é improvável que a derivada do modelo corresponda a uma inclinação ao nível do fenômeno físico, é ainda mais improvável que o a segunda derivada. pode ser associada a uma noção de curvatura, apesar do que a matemática pura exprime ... O progresso de um estudo geoestatístico exige, portanto, mais uma vez, satisfazer uma procura de equilíbrio: por um lado, é legítimo tentar usar o modelo para expressar propriedades dos fenômenos que não poderiam ser demonstradas por uma simples manipulação dos dados brutos; mas, por outro lado, é fundamental dar-se os meios para controlar as conclusões do modelo, voltando ao que está na base de todo o processo, a saber, a própria RV.
Quando isso não levantar qualquer ambiguidade, a seguir respeitaremos os hábitos de notação em uso na literatura geoestatística francófona:
representa o valor médio do VR no domínio , sem prejulgar o tamanho do espaço inicial. Já a notação representa a medida (no sentido matemático) do domínio : comprimento, área ou volume, dependendo se o espaço inicial é uma, duas ou três dimensões.
Um VR não pode se limitar a uma coleção de valores digitais localizados em pontos do espaço de trabalho, porque “os valores digitais não são a realidade, mas uma primeira imagem (analiticamente muito rica, estruturalmente muito pobre) dela. Ci”: apenas uma primeira imagem. Claro, nada impediria o desenvolvimento de algoritmos geoestatísticos baseados unicamente neste aspecto puramente quantitativo e contando exclusivamente com a precisão matemática das operações; no entanto, é claro que, ao fazê-lo, estaríamos a privar-nos de informações importantes, ausentes dos dados e, no entanto, essenciais para garantir a pertinência do futuro tratamento desses dados. Além disso, mesmo que o conjunto de dados brutos constitua a única informação indiscutível e o último recurso em caso de dúvida metodológica, "o resto - as ideias que podemos formar sobre a gênese e a estrutura do fenômeno, e, de forma mais geral, a nossa intuição física - no entanto, continua a desempenhar um papel muito importante nos bastidores. Em geral, é nesse tesouro arquetípico que teremos a chance de encontrar os esquemas ou os princípios orientadores de modelos verdadeiramente adaptados. "
Essas informações, na maioria das vezes qualitativas, que agregam significado aos dados processados, só podem ser adquiridas por meio do diálogo entre o geoestatístico, por um lado, e o naturalista, por outro, ou mais geralmente o médico que apresentou o problema. Esta fase de diálogo é ainda mais crucial porque, se negligenciada, geralmente não haverá salvaguardas para proteger em desenvolvimentos subsequentes contra tratamentos desprovidos de significado físico, de modo que se corre o risco de cruzar o " limiar do realismo ", mesmo sem estar ciente disso . A dificuldade é que o geoestatístico, especialmente se ele se aproxima de um campo de aplicação novo para ele, não saberá necessariamente com o que se preocupar com o naturalista; e, inversamente, o naturalista que não está familiarizado com as teorias implementadas não saberá necessariamente em qual ponto sensível ele deve enfatizar.
Existem, no entanto, constantes, características da RV que o geoestatístico deve conhecer seja qual for o estudo realizado, sob pena de perder imediatamente todo o contato com o significado físico de suas operações. Podemos, portanto, em todos os casos distinguir três atributos (natureza, domínio e escala de trabalho, suporte) e uma propriedade (aditividade), da qual o geoestatístico deve estar ciente e manter o controle.
A natureza da RV não parece representar um problema em geral: é simplesmente uma questão de primeiro notificar de qual variável de interesse estamos falando e de especificar a unidade usada para medir os dados (ou as diferentes unidades no caso de um RV multivariável).
Obviamente, é importante que, em um conjunto de dados, todas as amostras sejam da mesma natureza e sejam expressas nas mesmas unidades:
É verdade que o formalismo do processamento multivariável é mais pesado e às vezes mais difícil de manusear do que o estudo de uma única variável escalar. Poderíamos então ser tentados a converter a priori dados inicialmente díspares em uma única unidade e, então, lidar com o problema de uma perspectiva monovariável. Esta técnica não é recomendada: ela esconde a heterogeneidade do material que será manuseado posteriormente e, portanto, elimina informações potencialmente importantes. Na verdade, é recomendável ter o cuidado de distinguir amostras que são, no entanto, estritamente da mesma natureza, mas tiradas com equipamento e / ou em momentos muito diferentes. Por exemplo, não seria sensato realizar um estudo de mapeamento subaquático misturando dados da década de 1960 (antes do posicionamento GPS, os erros de localização poderiam ser vários hectômetros em mar aberto) e dados atuais ou, mais exatamente, é desejável "fazer entender "para o processamento futuro de que os dados são de qualidades diferentes.
Este último exemplo chama a atenção para um ponto frequentemente esquecido, mas que é importante para um trabalho geoestatístico cuidadoso. Idealmente, seria desejável que qualquer variável fosse associada a um indicador de sua qualidade. Afinal, a maioria dos fabricantes fornece informações sobre a precisão de seus instrumentos para profissionais, e seria uma pena não usar esse conhecimento. Nos casos mais básicos, isso é simplesmente uma margem de erro, um único intervalo de confiança para todas as medições. Mas a situação pode ser muito mais complexa: assim, para medições de batimetria realizadas por um vaso ao longo de perfis paralelos, é provável que os erros de localização ao longo do mesmo perfil estejam fortemente correlacionados, embora sejam talvez independentes entre dois perfis . Esta é uma informação muito importante, que em nenhum caso pode estar contida nos únicos valores da batimetria medida. Seria, portanto, muito lucrativo, na medida do possível, associar ao VR de interesse um segundo VR que quantificasse a precisão do primeiro, ou seja, trabalhar em um VR bidimensional (valor, precisão): esta abordagem , o que certamente acrescenta peso aos cálculos, não é feito com frequência, mas é importante saber que está acessível às ferramentas geoestatísticas.
Último ponto sobre a natureza da RV: ao contrário do que seria uma abordagem puramente matemática que se concentraria apenas em valores numéricos, independentemente de suas interpretações e unidades, a abordagem do geoestatístico é guiada pelo significado e pela natureza dos dados que examina . Mesmo que a curva seja a mesma (com possíveis mudanças próximas às unidades nos dois eixos), o médico não reagirá da mesma forma ao gráfico de uma série temporal dependendo se ela descreve a temperatura de um paciente, o mercado de ações preço, a posição de uma partícula ou uma sequência de precipitações em uma bacia hidrográfica ... Porque qualquer campo de trabalho tem suas especificidades, assim como os especialistas em cada campo têm suas próprias experiências, e seria lamentável, até mesmo desastroso, privar-se desse conhecimento adicional. Levar em consideração a natureza da RV constitui uma segurança, uma proteção contra o risco de ultrapassar o limiar do realismo: todas as outras coisas sendo iguais, provavelmente seremos capazes de aceitar valores modelados negativos no caso de altitudes (é simplesmente profundidades subaquáticas); isso se tornará uma preocupação, embora teoricamente aceitável, se se tratar de lucros corporativos; e isso seria perfeitamente absurdo se se tratasse de pressões atmosféricas. Mais ainda: é provável que, ao se deparar com um perfil representativo de altitudes e plotado sem especificar as unidades, o praticante não reaja da mesma forma se pensa que é um perfil de extensão quilométrica ou que é o perfil de um todo continente: um mapa sem unidades poderia satisfazer o matemático puro, mas é quase inútil para o praticante - pelo menos do ponto de vista da geoestatística.
Ao contrário do domínio (matemático) de validade de um modelo, o domínio da RV - considerado agora como um objeto físico - é uma noção ambivalente.
Ponto de vista "upstream"Em primeiro lugar, é a porção de espaço e / ou tempo em que os dados estão disponíveis. Obviamente, como os dados são sempre compostos por um conjunto finito de valores numéricos, o domínio deve ser entendido como um envelope de pontos de dados, geralmente dilatados (no sentido morfológico ). É, portanto, uma definição que deixa espaço para um elemento de arbitrariedade e que está intimamente associada à noção intuitiva, muito comum mas imprecisa, de “zona de influência” dos dados; em outras palavras, o domínio (de definição) da RV é a porção do espaço dentro da qual se pode acreditar que os dados disponíveis fornecem informações significativas. Por mais confusa e em última análise insatisfatória que possa ser, esta formulação é de inegável interesse: ela enfatiza que a extensão do domínio onde a RV pode "razoavelmente" ser considerada conhecida não depende apenas da geometria da informação, mas também da estrutura intrínseca da variável estudada: é de fato claro, por exemplo, que para um dado esquema de amostragem, o domínio de uma variável muito errática deve ser considerado menos extenso do que o de uma variável altamente estruturada e com pouca flutuação; em outras palavras, em um ponto remoto dos pontos de medição, os dados disponíveis fornecem menos informações se o VR for errático do que se flutuar pouco.
Essa observação chama a atenção para um ponto metodológico muito importante. Expressa de fato que a delimitação do domínio de um VR não deve depender apenas da informação já disponível (a geometria da amostragem), mas também da estrutura do VR, que é uma característica que procuramos justamente. a ser destacado pelo processamento geoestatístico. Esta é de fato uma “restrição a montante”, na medida em que existe antes do início do estudo e independentemente das escolhas do geoestatístico; mas constitui apenas informação futura que será revelada gradualmente e que deve ser conhecida como antecipar. Ou seja, no início de um estudo, não sabemos a priori com precisão qual é o domínio de validade das operações que vamos realizar, pelo menos com base nos únicos valores numéricos disponíveis: uma noção de que aquele que pensaria que básico (o domínio de definição de RV) é na verdade parcialmente dependente do que o estudo posterior irá destacar. Por isso é normal, de fato necessário e fecundo, que um estudo aplicado não proceda de forma linear, mas proceda por retrocessos e reajustes dos modelos de acordo com o andamento dos trabalhos.
O confronto do campo com a geometria da informação disponível constitui uma primeira abordagem da muito importante noção de escala de trabalho. Por exemplo, se o domínio reconhecido é o território metropolitano francês, é óbvio que teremos um melhor conhecimento dele com 551.000 dados distribuídos em uma grade quadrada de lado 1 km do que com, por exemplo, 95 dados implantados a uma taxa de um por departamento. Grosso modo, como este exemplo simplista sugere, podemos antes de tudo comparar a noção de escala de trabalho com a de densidade de informação. No entanto, esta aproximação não é mais válida assim que a amostragem é distribuída de forma heterogênea: assim, durante uma campanha de batimetria realizada em perfis de navegação paralelos e amplamente espaçados, perfis eles próprios amostrados de forma muito densa, é muito difícil definir uma escala de trabalho globalmente significativa. ; claramente, teremos uma escala muito fina na vizinhança imediata dos perfis, e solta quando estivermos longe de qualquer perfil. Este problema é esclarecido em geoestatística pelo importante conceito de variância da estimativa , uma ferramenta quantitativa que está intimamente associada à escala de trabalho, e que constitui um primeiro indicador fundamental para medir a qualidade e confiabilidade da modelagem realizada.
Ponto de vista "a jusante"Mas o domínio da RV também depende do problema proposto, e juntamos aqui a reflexão sobre o domínio da definição (matemática) do modelo. É certo que a porção do espaço sobre a qual nos perguntamos é freqüentemente muito semelhante ao campo no qual se tem os dados: este é o caso, em particular, ao realizar interpolações . Assim, por exemplo, a extensão de uma jazida mineral que se busca estimar estará muito próxima do envelope de dados disponíveis; da mesma forma, não produziremos um mapa topográfico dos Alpes com dados medidos em Beauce ...
No entanto, esse requisito de bom senso nem sempre pode ser satisfeito. Às vezes, é a própria natureza do problema que exige que o domínio estudado exceda o domínio reconhecido pelos dados: este é o caso, em particular, quando se trata de fazer previsões. Pensaremos em exemplos imediatos em economia, epidemiologia, meteorologia e climatologia, quando o espaço de trabalho for o tempo. Mas existem circunstâncias mais ocultas. Por exemplo, ao tentar estimar as reservas de um depósito, a área em que desejamos fazer o inventário da substância a ser explorada corresponde obviamente à geometria do depósito, exceto que esta informação não está disponível: o limite do depósito Não é conhecido. A única coisa que pode ser dita é se um determinado poço está ou não no campo. Além disso, a informação disponível é geralmente toda interna ao depósito, pela simples razão de que os fabricantes não gostam de financiar perfurações ou análises realizadas em estéril : em outras palavras, o limite do domínio só pode ser avaliado por extrapolação., Que é geralmente uma fonte de instabilidades digitais. Do ponto de vista metodológico, o perigo é ainda maior, uma vez que a própria definição do campo é geralmente baseada em um limite de conteúdo; no entanto, esta variável - o conteúdo - é precisamente o objeto do estudo: na melhor das hipóteses, estamos, portanto, expostos a efeitos colaterais , que muitas vezes são imprevisíveis e que às vezes mascaram completamente a informação útil. Mas mais profundamente, vemos um obstáculo teórico sendo colocado em prática que é semelhante ao argumento circular , isto é, apenas caricaturante: " precisamos da solução (o conteúdo em todos os pontos) para colocar o problema corretamente (delimitar o volume em que vamos estimar o depósito) ”; se nos limitarmos apenas aos dados numéricos e não quisermos cometer uma falha metodológica grave, estamos num beco sem saída. O reforço da informação externa aos dados digitais é então, aqui, absolutamente essencial.
Além disso, mesmo permanecendo em uma área de estudo muito semelhante à área reconhecida, pode-se querer mudar a escala de trabalho. Assim, no exemplo proposto ao lado, se se deseja realizar uma cartografia dos valores geoquímicos em uma malha quadrada de lado 5 m , isso significa que se deseja um resultado em uma escala aproximadamente 15 vezes mais fina que a escala do informação inicial, já que a distribuição dos dados equivale em média a uma grade de 75 m . Há um ponto crucial a se notar aqui: absolutamente nada, no início do estudo e com base em apenas 412 dados, permite saber se o projeto de refinar por um fator de 15 a escala inicial é legítimo ou não. . É claro que a justificativa para esta operação dependerá intimamente da estrutura da variável estudada, e que uma operação aceitável para uma variável muito fortemente estruturada se tornará irreal para uma variável muito errática; o problema é que essa estrutura só pode ser entendida com base nos dados disponíveis, ou seja, na escala mais ampla: estamos diante de um problema muito semelhante metodologicamente ao que se encontra no sinal teórico . Mais uma vez, o praticante deve invocar sua experiência, e saber antecipar-se, antes que as manipulações críticas lhe permitam - mas apenas a posteriori - julgar a relevância de suas escolhas.
Ilustração resumidaCom base nos dados mencionados anteriormente (geoquímica na ilha de Vulcano), as imagens a seguir ilustram alguns problemas relacionados à representação de um RV e seus atributos:
Esta figura simplista ilustra um dos primeiros propósitos do trabalho geoestatístico elementar: “preencher lacunas de informação”. Com efeito, além dos limites do domínio que aqui se impõem, a única coisa realmente conhecida é o conjunto de 412 dados, localizado na primeira miniatura: mas esta informação objetiva não pode ser mapeada em todo o domínio, uma vez que isso constitui um continuum . Esta primeira imagem é muito difícil de ler e interpretar estruturalmente.
A segunda vinheta oferece uma primeira faixa de visualização: uma partitura de Voronoï , com um código de cores que permite ter uma ideia da estruturação espacial da RV. Mas nem é preciso dizer que esta é uma representação muito grosseira e que ninguém vai imaginar que a realidade (como se poderia observá-la se fizéssemos medições adicionais) pode de fato se parecer com o que mostra esta imagem. Esta é uma primeira modelagem, uma primeira interpolação, aliás extremamente questionável. Na verdade, tem propriedades matemáticas (é constante por partes) que, neste caso, não têm chance de corresponder a uma realidade física.
As duas últimas miniaturas representam exatamente o mesmo conjunto de valores, que é uma interpolação construída com base nos dados 412. Apenas as escalas de representação são diferentes, respectivamente de 75 m e 5 m . O primeiro desses valores foi escolhido por ser equivalente ao que seria uma distribuição regular dos dados 412: assim, há o mesmo número de valores do VR representado nas miniaturas 2 e 3. Observamos que estes os parâmetros “Downstream”, arbitrários, têm um impacto significativo na aparência dos cartões. Podemos imaginar que o aspecto xadrez da terceira vinheta é um artefato puro ; mas deve ser visto que um efeito bastante semelhante apareceria na quarta vinheta se o observássemos com mais detalhes ... Esses efeitos, consequências claramente visíveis do modo de operação aqui, são estritamente inevitáveis, e é importante não fornecê-los um significado físico que eles não poderiam ter.
A noção de escala, um conceito essencial da geoestatística: elementos de reflexão
Não faz absolutamente nenhum sentido falar de uma "grande escala" ou uma "grande" distância. É claro que é legítimo comparar escalas e dizer que uma é mais fina que a outra e, a fortiori, comparar comprimentos, mas esse aspecto relativo explica de maneira muito imperfeita a complexidade da noção e seus problemas.
A escala de trabalho depende de pelo menos três fatores, que não são todos acessíveis ao mesmo tempo de um estudo e que às vezes apresentam requisitos contraditórios:
Um grande problema metodológico é que este último e mais importante fator não é conhecido no início do estudo e só vem à luz gradualmente. Muito mais: o seu conhecimento depende da densidade da informação, havendo no pior caso a possibilidade de ocultar as propriedades do fenômeno pelas propriedades do sistema de amostragem (forte analogia com o teorema de Shannon e aliasing ). Mas sem chegar a casos extremos, é claro que as melhores características estruturais não podem ser destacadas com uma malha de reconhecimento solta. Novamente, devemos buscar um equilíbrio entre o que é desejável (um conhecimento detalhado do fenômeno - mas talvez informações muito precisas sejam supérfluas para o problema proposto?) E o que é possível (a coleta de informações tem um custo, e às vezes é até destrutiva )
Este equilíbrio é crucial porque, ao contrário do que geralmente acontece de uma perspectiva puramente matemática, a percepção que temos das propriedades de um VR é essencialmente dependente da escala em que questionamos este VR considerado como um objeto físico. Assim, o mesmo objeto, por exemplo uma cordilheira de 100 km , não terá as mesmas propriedades para um fotógrafo que captura seu perfil panorâmico geral com a intenção de uma revisão de geografia (escala de trabalho aproximada: cerca de dez quilômetros), e para um montanhista quem escala os principais picos desta mesma cadeia (escala de trabalho aproximada: menos de um decâmetro); mesmo VR, mesmo domínio, mas escalas de trabalho muito diferentes: os modelos matemáticos relevantes serão, sem dúvida, muito diferentes também.
Muitas vezes é supérfluo, ao concluir um estudo, relembrar os parâmetros estruturais da variável estudada (ponto 3 acima), embora esses parâmetros tenham sido os mais importantes para a realização da modelação que permitiu o estudo: o operador mineiro quer sobretudo um avaliação de seu depósito, não uma imagem teórica desse depósito. Por outro lado, é importante que os parâmetros que descrevem a amostragem inicial (ponto 1) não reapareçam como elementos perturbadores do resultado final: um mapa de batimetria deve representar o relevo subaquático, não o curso da embarcação que realizou as medições . Por fim, assim como toda figura deve ter legenda e qualquer mapa de eixos graduados, é imprescindível que o arcabouço do estudo (ponto 2) seja relembrado detalhadamente na conclusão do trabalho, pois é dele que depende o sentido. dos resultados: é uma garantia contra o risco de “ extrapolação metodológica ”.Para simplificar ... ↑ ↓ | |
Sem importância se nos atermos a um formalismo matemático puro, os conceitos de natureza e domínio de uma RV, bem como a noção de escala de trabalho, são essenciais para a compreensão do fenômeno estudado e o realismo das operações empreendidas. Levar em consideração a natureza da RV torna possível situar o estudo em seu contexto físico, para evitar um possível uso excessivo de modelos matemáticos e se beneficiar da experiência dos praticantes. A delimitação do domínio , seja imposta por considerações externas ou que resulte das propriedades do próprio VR, é decisiva para detectar os possíveis efeitos colaterais e controlá-los ou pelo menos quantificá-los. Finalmente, a escala de trabalho é um elemento complexo, dependendo tanto de parâmetros contingentes (a montante: o esquema de amostragem; a jusante: a estrutura do problema proposto) quanto de fatores inerentes à física da RV. O usuário tem apenas uma liberdade parcial para definir sua escala de trabalho e, ao mesmo tempo, deve ter em mente que a resposta a um problema geoestatístico aparentemente único é, na verdade, essencialmente dependente da escala que foi adotada. |
Matematicamente, um VR será uma função no espaço inicial, portanto, assumirá um valor em qualquer ponto deste espaço. Nessas condições, "conhecer" certos valores do VR significaria que a medição foi realmente realizada em um número (necessariamente finito) de pontos. No entanto, nunca se pode realizar tal medição: mesmo para variáveis tão simples como dimensões topográficas, temperaturas ou pressões, os valores comunicados pelo aparelho nunca são estritamente pontuais, pelo menos devido ao tamanho do dispositivo de medição; e da mesma forma, uma medição de tempo nunca é estritamente instantânea, qualquer dispositivo exibindo um efeito de histerese mais ou menos pronunciado. Podemos, é claro, considerar que nos primeiros exemplos que acabamos de citar, não há perigo em considerar os dados como apreciavelmente pontuais, mas há situações em que essa aproximação não é mais aceitável. Assim, na geoestatística mineira, sempre se faz uma análise mineralógica sobre uma amostra de determinado volume (um núcleo , por exemplo), sendo que o valor da nota que se obtém é de facto, neste caso, a média das notas. presente ocasional nesta cenoura. O valor medido, portanto, depende da variável de interesse (o conteúdo), mas também de parâmetros contingentes, como o tamanho e a forma do núcleo. A mesma coisa na meteorologia, onde a precipitação medida não é uma quantidade de água que caiu instantaneamente, mas o acúmulo do que caiu durante um período arbitrariamente fixo. Como último exemplo mais complexo, podemos finalmente citar a medição da elevação do oceano , atualmente conhecida com precisão centimétrica: tal precisão, concernente a um fenômeno espaço-temporal que em um ponto de coordenadas fixas pode experimentar flutuações de algumas dezenas de metros, só faz sentido se a variável de interesse for definida como uma média calculada sobre um meio geográfico e intervalo de tempo bem especificados; e a robustez desta média dependerá inteiramente deste suporte e deste intervalo.
Também pode haver situações em que a própria natureza da RV torna impossível considerar medidas pontuais, mesmo aproximadas. Por exemplo, na prospecção de urânio, o valor de radioatividade medido em um ponto não depende apenas da atividade da fonte de rádio localizada naquele ponto, mas de todo o ambiente, e isso seguindo uma lei de ponderação perfeitamente conhecida. O mesmo se aplica à geofísica (gravimetria ou magnetismo): os valores observados em um ponto são indicativos de todo um ambiente, entendendo-se que regiões mais distantes têm influência mais fraca do que a proximidade imediata do ponto onde a medição é feita. medido.
Desta forma, qualquer medição é na realidade uma regularização mais ou menos acentuada ( suavização ) dos valores pontuais do VR (no sentido matemático). Este efeito de regularização é sempre inerente ao processo de fazer medições e, às vezes, além da natureza do fenômeno que está sendo medido. Pode ser modelado facilmente: uma medida instrumental sempre aparece matematicamente como o produto da convolução do VR (teoricamente ponto) por um determinado operador dependendo do dispositivo de medição e / ou da física do fenômeno. No entanto, duas observações:
Para resumir ... ↑ ↓ | |
Embora frequentemente considerado pontual, por uma questão de simplicidade, o suporte VR fornece uma imagem do domínio espacial que, nas proximidades de cada ponto de medição, contribui para o valor atribuído ao VR naquele ponto. As características desse suporte dependem do equipamento e das condições de medição e, às vezes, da física do fenômeno. Matematicamente, um suporte pontual intervém no formalismo geoestatístico como operador de convolução; na prática, isso equivale esquematicamente a uma média móvel (possivelmente ponderada). |
A consideração de um apoio à regularização introduz, portanto, um novo fator de escala. Este novo fator intervém mais discretamente do que os outros quando se trata de definir as condições de processamento dos dados, por exemplo durante estimativas ou simulações numéricas: a escolha dos pontos de dados a serem usados para realizar uma interpolação é muito mais dependente da estrutura de o fenômeno e a densidade da informação do que no meio; por outro lado, o suporte tem uma importância considerável nas estatísticas efetuadas sobre os dados e, em particular, no que diz respeito à variabilidade . Assim, uma das primeiras contribuições históricas notáveis da geoestatística, no campo da mineração, consistiu em explicar e modelar o fato de que os teores medidos em seções delgadas eram mais flutuantes e menos estruturados do que os teores (do mesmo minério, na mesma mina) medido em cenouras.
Última observação: o fenômeno da regularização tem um impacto direto na estrutura dos instrumentos de investigação estrutural, em particular o variograma , e este impacto característico é muito fácil de modelar. Além disso, ao contrário, as ferramentas geoestatísticas podem, em certos casos, permitir o diagnóstico de que as medições que se pensava serem quase-pontuais são na realidade regularizadas.
Um VR será considerado “aditivo” se o valor geral que assume em um conjunto de domínios geográficos separados for igual à soma dos valores assumidos em cada um desses domínios. Por exemplo, em uma mina a céu aberto, a tonelagem de metal contida em uma etapa é de fato igual à soma das tonelagens em cada um dos blocos distintos que constituem esta etapa: a quantidade de metal é uma variável aditiva; ainda mais simples neste exemplo, é o mesmo para o volume. Da mesma forma, quantidades de calor ou eletricidade, massas, volumes produzidos por um poço de petróleo (em função do tempo), etc. são variáveis aditivas. Esta propriedade é particularmente interessante porque torna os mecanismos de mudança de escala muito fáceis, ao mesmo tempo que mantém uma noção física das operações.
Sem serem aditivas, há variáveis que também se beneficiam de boas propriedades, porque podemos ser reduzidos ao caso anterior por meio de uma simples transformação. É o caso, por exemplo, do conteúdo: o conteúdo global de um conjunto de vários blocos não é igual à soma dos conteúdos de cada um deles; mas se multiplicarmos cada um dos conteúdos pelo volume do bloco correspondente, obtemos uma massa que é uma variável aditiva, e a soma das massas dividida pela soma dos volumes dá o conteúdo geral. Desta vez, o resultado final é obtido não sendo mais uma soma, mas uma média ponderada; note, além disso, que se todos os blocos tivessem o mesmo volume, seria uma média aritmética simples. Esta situação encontra-se, por exemplo, na hidrogeologia com uma variável como a porosidade , na agricultura com rendimentos por hectare, na epidemiologia com números de doentes por município ou por departamento, no ambiente com taxas de poluição. No último caso, também podemos voltar ao caso temporariamente aditivo se for uma substância que não se degrada, como um metal pesado , etc. Notamos em todos os casos que para voltar a uma quantidade aditiva, é necessário usar uma variável auxiliar, muitas vezes de natureza geométrica, como a área ou o volume, a duração ou a massa: também é naturalmente necessário que esta a variável auxiliar foi amostrada corretamente, e este é um caso em que o geoestatístico pode ser um bom conselho para seu cliente na campanha de medição.
O interesse metodológico de uma variável aditiva é considerável. De fato, realizando acumulações dessa variável em domínios tão diversos quanto possível, sempre se obtém valores que têm um significado físico claro e que, além disso, podem ser - pelo menos pelo pensamento - objeto de controles experimentais. Além disso, as ferramentas mais simples da geoestatística linear permitem formalizar teoricamente essas transformações (acumulações ou médias ponderadas) e torná-las operacionais. O único limite contingente a essa fase de controle é a quantidade de informações disponíveis.
Para simplificar ... ↑ ↓ | |
Uma variável aditiva mantém o mesmo significado físico em todos os suportes: seu valor no todo (geográfico) é igual à soma de seus valores nas partes. Por extensão, podemos manter cuidadosamente a mesma palavra para qualificar variáveis que podem ser reduzidas ao caso aditivo estrito ao custo de uma transformação simples. Nessas condições, uma variável aditiva tem a particularidade de não causar efeito de emergência . Sem ser estritamente essencial para o trabalho geoestatístico, a propriedade da aditividade facilita consideravelmente os desenvolvimentos teóricos, especialmente se for necessário realizar mudanças de suportes ou escalas. Em contraste, as variáveis não aditivas exigem muito cuidado em sua manipulação e tornam a fase de reconstrução operatória muito mais crucial e muito mais difícil. |
Para nos aproximarmos de uma noção comum, podemos dizer que o aditivo VR ou que pode ser reduzido a um comportamento aditivo tem a particularidade de não causar um fenômeno de emergência .
Infelizmente, muitas variáveis não são aditivas. Por exemplo, uma temperatura não só não é aditiva no sentido estrito, mas não é certo que uma média de temperaturas tenha um significado físico indiscutível, seja essa média espacial ou temporal. Isso não significa, é claro, que essa média será inútil: pode-se então imaginar que ela ocupa um lugar legítimo (por exemplo) nas equações de evolução; podemos até (pelo menos pelo pensamento) controlá-lo "na base" e, portanto, ele tem um significado objetivo; mas é impossível imaginar um fenômeno físico que, em um dado lugar e em uma determinada data, tome o valor indicado por esta média espaço-tempo: este valor não é, portanto, nem mais nem menos que o resultado de um Cálculo de processo.
Outro exemplo de VR não aditivo, muito mais complexo de tratar, é fornecido pela hidrogeologia com a permeabilidade variável . Não existem relações simples entre as diferentes permeabilidades medidas em diferentes escalas (microscópica e macroscópica); não existe uma expressão simples que permita relacionar a permeabilidade em duas unidades de volume e a permeabilidade resultante na união desses dois volumes, e mesmo as expressões disponíveis dependem da dimensão do espaço. Nessas condições, fica claro que uma soma (possivelmente ponderada) de duas permeabilidades não tem significado físico e, mesmo que nenhuma mudança de escala seja acionada, uma simples interpolação já pode ser problemática: neste caso, não é o matemático ferramentas que mostram fragilidades, mas é um fenômeno físico que revela sua extrema complexidade. Nessas condições, e mais geralmente para RVs não aditivos, nem é preciso dizer que o trabalho geoestatístico deve ser realizado com o máximo de cautela.
Desde os primórdios da geoestatística, os limites inerentes a um trabalho baseado exclusivamente no modelo primário surgiram tanto no nível teórico quanto no nível de implementação. Os formalismos desenvolvidos, e que constituem o tema da geoestatística transitiva , são expressos essencialmente por informações disponíveis em uma malha regular (possivelmente com lacunas), que pode ser adequada para determinados problemas (análise de imagens, por exemplo, ou estimativas de superfície ou volume), mas não é adequado para amostragem irregular como encontrado na maioria dos estudos: esta dificuldade foi encontrada desde os primeiros trabalhos aplicados, que diziam respeito a estimativas de mineração. No entanto, poderia ter sido interessante buscar resolver este problema puramente técnico, permanecendo dentro da estrutura do modelo primário, uma vez que este modelo parece satisfatório: ele de fato não requer qualquer suposição particular relativa à estrutura do VR estudado, e o as ferramentas da geoestatística transitiva são essencialmente adaptadas para trabalhar em um campo delimitado, que corresponde exatamente à estrutura de um estudo real.
Piscadela antropocêntrica ... ↑ ↓ | |
Devemos evitar pedir a um modelo que se julgue. Na melhor das hipóteses, ele não será capaz; na pior das hipóteses, será hipócrita. O modelo primário e a geoestatística transitiva não são exceção a esta regra. Ferramentas e suposições adicionais são necessárias para quebrar o impasse, e a escolha da geoestatística intrínseca é recorrer a um formalismo probabilístico. |
No entanto, um obstáculo básico surge assim que se deseja avaliar a qualidade dos resultados propostos. Com efeito, quer se trate de interpolação, estimativa ou qualquer outra operação algorítmica realizada em um conjunto de dados, é claro que não é possível ficar satisfeito com a produção de um único número (ou um único cartão); também é necessário que tenhamos uma medida pelo menos indicativa da confiabilidade desse resultado. No entanto, surge aqui um resultado profundo, que estabelece os limites do método transitivo: “ É teoricamente impossível deduzir dos mesmos dados experimentais uma estimativa e a precisão desta estimativa. "Ficar com o uso exclusivo da RV não tem saída: se" concordarmos em dizer que um modelo é estritamente objetivo se seus critérios de especificação envolverem apenas parâmetros objetivos (identificáveis com grandezas regionais) e parâmetros metodológicos (impostos sem ambigüidade pelo problema para ser resolvido e o método escolhido) com exclusão de qualquer outro tipo de parâmetros convencionais ”, então“ é claro que um modelo estritamente objetivo - e precisamente porque é estritamente objetivo - não pode ser apenas tautológico : ele apenas representa de outra forma a mesma informação, aquela que está contida nos dados do VR ”.
Do ponto de vista teórico, existe um círculo vicioso. “ Na prática, porém, a introdução de certos pressupostos razoáveis de aproximação ou simplificação permite quebrar o círculo ”: estes são os pressupostos antecipatórios, “ com a sua fecundidade e a vulnerabilidade que isso implica ”. Historicamente, para dados organizados nos nós de uma grade regular, a geoestatística tem usado um subterfúgio: considere que a origem da grade foi escolhida aleatoriamente de uma forma uniforme que ipso facto dá às quantidades regionais um status aleatório e que, portanto, abre a porta a possíveis cálculos de variação , ou seja, ferramentas de medição de qualidade. Esta abordagem parece tanto mais satisfatória quanto não implica qualquer hipótese a priori quanto às propriedades (estatísticas, estruturais) do próprio VR. Superficialmente, o problema está resolvido, mesmo que a resposta dependa fortemente da regularidade da malha de amostragem: obviamente, há muitas situações em que assumir que os dados regularmente distribuídos não serão uma aproximação aceitável. Mas há um resultado mais profundo que a abordagem teórica destaca: todas as outras coisas sendo iguais, a variância teórica de um estimador pode apresentar flutuações numéricas consideráveis e incontroláveis para pequenas variações da dimensão da malha. Inesperadamente, nos encontramos no que Matheron chama de " situação preliminar ": "A" ideia do acaso ", ou seja, na realidade, o uso de modelos probabilísticos, é introduzido na física" quando as condições iniciais inseparáveis experimentalmente são subsequentemente seguido por uma separação óbvia dos fenômenos observados ". »E mais tarde, quando optamos por representar a função estrutural - que é uma grandeza regional - por um modelo mais simples, podemos interpretar este modelo« como uma transição para a expectativa matemática ». De certa forma, o arcabouço probabilístico se impõe.
A geoestatística intrínseca optou por dar o mergulho e colocar deliberadamente como parte de uma modelagem probabilística, e essa escolha ocorre desde o início da geoestatística. Desenvolvimentos subsequentes mostraram que, embora baseado em uma teoria muito mais abstrata do que a geoestatística transitiva, esse formalismo é perfeitamente operacional e abre mais perspectivas. O formalismo transitivo pode ser considerado a origem da morfologia matemática e apresenta um inegável interesse educacional; mas, no âmbito da geoestatística, quase não é mais usado, exceto para tratar de problemas de natureza geométrica.
Estatuto epistemológicoA escolha da geoestatística intrínseca é associar a qualquer VR uma função aleatória (FA), da qual o VR será considerado uma realização .
Essa escolha - por ser uma decisão perfeitamente arbitrária - é ditada apenas por considerações operacionais. Foi inspirado por reflexões sobre o status da RV e foi posteriormente reforçado pela prática e desenvolvimentos em geoestatística. Mas isso não significa que a realidade que estamos estudando realmente proceda de um fenômeno aleatório. Além disso, afirmar que o real é a emanação de alguma forma de acaso é uma proposição que não é verificável nem refutável e que, conseqüentemente, está fora do escopo do discurso científico. O que pode ser objeto de trabalho científico, por outro lado, é o estudo da adequação de um modelo aleatório à realidade estudada. Assim, com um grau fixo de aproximação, podemos verificar se um modelo probabilístico permite ou não dar conta das informações disponíveis, e é exatamente isso que a geoestatística se propõe a fazer; mas a resposta não é exclusiva, e é perfeitamente possível que modelos fundamentalmente contraditórios respondam simultaneamente pelo mesmo fenômeno com a mesma qualidade.
A fortiori , seria fútil procurar dar um sentido objetivo ao espaço probabilizado em que se define o AF: que realidade tangível poderíamos conceder ao universo em que se supunha que a RV estudada seria realizada? e, sobretudo, como poderíamos acessar a lei da probabilidade desta amostra, sabendo que só temos um resultado (o VR) da referida amostra? Dito isso, mesmo rejeitando especulações metafísicas sobre o espaço probabilístico, não podemos evitar a questão metodológica que subjaz a todo o processo de geoestatística intrínseca: como podemos justificar o uso de modelos probabilísticos para dar conta de um fenômeno único? A resposta é fornecida gradualmente, nos estágios sucessivos de configuração do formalismo intrínseco; Também se pode notar que esta questão é implicitamente o tema principal de Estimar e Escolher , que examina todos os seus aspectos e implicações.
Em qualquer caso, é claro que o uso da modelagem probabilística desenvolve ferramentas mais abstratas do que o tratamento direto da RV e que, consequentemente, os riscos de perder o contato com a realidade e ultrapassar o limiar do realismo são consideravelmente aumentados. Essa tomada de risco só se justifica pela eficácia desse novo nível de abstração, eficácia notada por todos os estudos e todos os desenvolvimentos realizados desde o início da geoestatística aplicada. Basicamente, os cuidados metodológicos a serem tomados são exatamente aqueles mencionados em relação ao modelo primário e, portanto, embora sejam mais cruciais aqui, não há necessidade de repeti-los. Paradoxalmente, embora ainda houvesse um risco real de confusão no nível do modelo primário, visto que a RV poderia facilmente ser confundida com o fenômeno, o perigo de confusão aqui é mínimo: ninguém jamais observou um espaço probabilizado, ninguém observou nunca tocou em uma lei de probabilidades. Esses seres matemáticos, dos quais muito se espera em termos de construções teóricas, não são de forma alguma magnitudes regionais : são puros artefatos , produtos de nosso intelecto. É, portanto, claro que os elementos do espaço probabilizado devem ser imperativamente excluídos do resultado final se este alega poder ser associado a uma propriedade física controlável "no campo": a fase de reconstrução operativa é aqui crucial se o queremos simplesmente que as conclusões de um estudo tenham um significado concreto.
Convenções de redaçãoUm espaço probabilizado é geralmente representado por um trio
ou :
Se, como nos exemplos anteriores, designarmos o espaço inicial (“geográfico”) por , uma função aleatória será definida como sendo uma família de variáveis aleatórias definidas no espaço de probabilidade e com valores no espaço de chegada, esta família sendo indexado por . Uma possível notação é, portanto,
Lembre-se: ↑ ↓ | |
É comum em publicações geoestatísticas representar convencionalmente quantidades regionais (determinísticas) em letras minúsculas e as quantidades aleatórias associadas em letras maiúsculas. Além disso, na maioria das vezes, as funções aleatórias são apresentadas como sendo uma função apenas do espaço geográfico, omitindo a referência ao espaço de probabilidade em que são definidas. |
No entanto, este escrito não destaca suficientemente o fato de que o conjunto deve ser um espaço métrico, e que estamos principalmente interessados nas propriedades estruturais de consideradas como uma função em . Assim, a geoestatística prefere denotar uma função aleatória como uma função de duas variáveis, uma abrangendo o espaço de probabilidade e a outra o espaço “geográfico”. De modo que o uso será, por exemplo, para representar um AF real na forma
.Esta apresentação na forma de uma função de duas variáveis mostra que:
Na verdade, por um lado, porque o espaço de eventos não tem realidade física (portanto, também), por outro lado porque é principalmente a estruturação no espaço de partida que interessa ao geoestatístico, geralmente escrevemos o FA em função de um variável única:, acentuando assim o paralelismo com o VR associado . A aleatoriedade é convencionalmente revelada pelo uso de uma letra maiúscula.
Assim, quando se associa um AF a um VR , será automaticamente possível associar a qualquer grandeza regional uma versão probabilística que será obtida substituindo em sua expressão o VR pelo AF; e, no nível de escrita, simplesmente equivalerá a mudar de minúsculas para maiúsculas. Assim, mantendo as convenções de escrita definidas anteriormente, temos a tabela de correspondência:
Versão VR | Versão FA | ||
---|---|---|---|
Status | Avaliação | Avaliação | Status |
Número | Variável aleatória | ||
Função | Função aleatória | ||
Número | Variável aleatória | ||
Número | Variável aleatória | ||
Função | Função aleatória | ||
Função | Função aleatória |
Resta agora esclarecer o mecanismo intelectual que regula a associação entre um VR e um AF e, em seguida, descrever como esse mecanismo intervém em um estudo geoestatístico.
De um ponto de vista puramente matemático, escrever um AF como sendo uma função de duas variáveis em um conjunto abstrato :
mostra como uma função aleatória gera variáveis regionalizadas: para cada evento fixo (elemento) da tribo , a aplicação parcial
Para torná-lo muito simples ... ↑ | |
Assim como a realização de um experimento aleatório pode ser considerada como o sorteio ao acaso, segundo uma certa lei das probabilidades, de um valor numérico entre todos os valores possíveis que uma variável aleatória pode assumir. Da mesma forma, a realização de uma função aleatória equivale a extrair ao acaso, de acordo com uma certa lei de probabilidades, uma determinada função entre todas as funções possíveis propostas pelo AF. No primeiro caso, o resultado da realização é um número (ou um multipleto de números); na abordagem geoestatística, o resultado de uma conquista é função do espaço “geográfico”, ou seja, uma variável regionalizada. |
na verdade, torna-se uma função de uma única variável definida em um único conjunto geográfico . Qualquer referência a um contexto probabilístico é agora descartada, de forma que, de acordo com as convenções de escrita, é legítimo representar esta função por uma letra minúscula. E essa função tem exatamente o significado de uma variável regionalizada. Portanto, quando você tem um AF , pode construir tantos VRs quanto puder escolher na Tribo de Eventos subjacente.
No momento, essa construção é puramente algébrica e só traz em jogo o espaço de probabilidade . O aspecto aleatório intervém na forma de escolha , e essa escolha dependerá da lei da probabilidade , de forma que intuitivamente, todos os VR possíveis associados a um mesmo AF geralmente não terão a mesma chance de serem sorteados. O mecanismo completo que consiste primeiro em desenhar um evento ao acaso e depois em associá-lo ao VR correspondente é chamado de realização do processo (sinônimo: do AF) e, por extensão, diremos resumidamente que "o VR é uma realização de o AF ".
Esta última formulação escapa tanto à tribo quanto à lei da probabilidade : isso não é de forma alguma estranho na medida em que esses dois conceitos matemáticos não têm existência estritamente objetiva, por esta razão devem intervir apenas o mais discretamente possível nos desenvolvimentos algorítmicos ( princípio da parcimônia ) , e não deve estar presente na declaração do resultado final de um estudo aplicado.
Por outro lado, deve-se enfatizar que a RV é apenas uma - e apenas uma - realização, entre muitas outras possíveis no âmbito do modelo probabilístico subjacente. Em outras palavras, o modelo FA é muito mais rico e complexo do que o modelo VR, e também muito mais abstrato porque depende de muitos fatores (tribo de eventos, lei da probabilidade) que não têm significado objetivo e, portanto, não podem ser o sujeito de um controle experimental. Em um nível prático, devemos estar cientes de que recorrer a um modelo probabilístico aumenta consideravelmente os riscos de ultrapassar o limiar do realismo ; e, no plano epistemológico, devemos questionar o significado de querer representar um único fenômeno (VR, para colocá-lo simplesmente) por um modelo aleatório: este problema, verdadeiramente fundamental e essencial, constitui o tema da obra de Georges Matheron Estimer et escolha . Quanto à justificativa para recorrer a um método inegavelmente mais difícil de implementar do que o modelo primário , é de natureza empírica: o desenvolvimento do trabalho e das ferramentas geoestatísticas desde meados da década de 1950 estabeleceu claramente o valor dessas ferramentas. termos de eficácia e justificou as complicações metodológicas que introduzem.
Quando um praticante se aproxima de um novo estudo, ele tem um conjunto de valores numéricos que constituem uma amostra do modelo primário, ou seja, de uma variável regionalizada. Se deseja trabalhar no quadro da geoestatística intrínseca, deve associar esta RV a uma função aleatória, sobre a qual as ferramentas teóricas permitirão estabelecer resultados beneficiando de toda a eficiência dos modelos aleatórios. Essa operação é chamada de “randomização” ou, mais raramente, imersão probabilística.
Embora mais comum, a palavra “randomização” não parece adequada, principalmente porque pode ser confusa. Na verdade, às vezes descreve a ação de obter amostras aleatórias de um conjunto de dados, e isso claramente não é o que acontece quando passamos de VR para AF.
No entanto, em seu sentido mais preciso, randomizar uma variável aleatória dependendo de um parâmetro significa que damos a esse parâmetro um status aleatório: a variável aleatória torna-se, de certa forma, "duplamente aleatória" ... Este ponto de vista é, desta vez , transponivel para a geoestatística intrínseca: consiste em considerar que um dado VR é na realidade uma função (determinística) indexada por um determinado parâmetro , logo em substituir este parâmetro por uma variável aleatória de um espaço probabilizado . Então, decidimos posar - com notações um tanto híbridas:
e definimos o AF associado ao VR pela relação:
.A escolha, usual em publicações geoestatísticas, de não incluir a segunda variável ( ) não é uma simples simplificação da notação. Isso evita chamar a atenção para um parâmetro que não possui realidade física e sobre o qual o praticante não tem meios de ação. Portanto, geralmente escrevemos um FA , a aleatoriedade (no modelo) dessa função sendo convencionalmente designada apenas pelo uso de uma letra maiúscula.
Examinando o mecanismo metodológico que passa aux , vemos que se trata de fato de mergulhar uma classe já muito rica de objetos matemáticos (o VR) em um todo infinitamente maior (o FA): a expressão "imersão probabilística", embora não usado com frequência, portanto, parece criterioso e será mantido no restante do artigo.
Finalmente, essa abstração crescente naturalmente leva a maiores riscos de ultrapassar o limiar do realismo, e o geoestatístico deve estar particularmente vigilante. Mas, em troca, ele se beneficiará de todo o arsenal de ferramentas e teoremas da teoria da probabilidade e dos processos estocásticos; e se, ao custo possível das transformações, ele se limitar a manipular FAs de variância finita , poderá dotar seu espaço (de FA) de chegada com uma estrutura espacial de Hilbert que lhe garantirá por teorema a correção de. resultados principais (interpolação, estimativa, filtragem, etc.): o ganho teórico é imenso e justifica plenamente os esforços rigorosos que devem ser feitos.
A animação abaixo lembra alegoricamente os três níveis de um estudo geoestatístico. A imagem de fundo representa um local de garimpo industrial de ouro, lembrando que um estudo de geoestatística aplicada visa responder a questões concretas, com desafios não só metodológicos, mas também técnicos e econômicos.
A primeira coluna se refere à realidade física, ao mundo no qual o problema a ser resolvido foi colocado. Os riscos de um estudo podem ser consideráveis: implicitamente, na ilustração proposta, trata-se de explorar um depósito mineral. A sanção final neste caso será a lucratividade da empresa: uma sanção que geralmente é inequívoca, mas que só chega no final do trabalho. Assim, a missão confiada ao geoestatístico é essencialmente antecipar o que acabará por ser uma simples observação - se pelo menos a operação for realmente realizada e concluída: trata-se, portanto, de ir mais longe do que os dados dizem hic et nunc , que só pode ser feito à custa de um exercício intelectual de modelagem .
A segunda coluna lembra que o primeiro nível de modelagem consiste em considerar o real como função, como ser matemático: é a introdução do conceito de variável regionalizada . Simbolicamente, o fundo da figura está parcialmente borrado aqui, para nos lembrar que o exercício de modelagem nos afasta parcialmente da realidade, tanto por não levar em conta toda a complexidade do real, quanto por introduzir, ao mesmo tempo, propriedades matemáticas que talvez não tenham contrapartida na realidade. Esta estrutura do modelo primário já permite processamento específico (estatísticas) e constitui o assunto da geoestatística transitiva.
A passagem para a terceira coluna constitui a característica da geoestatística intrínseca: consiste, a partir da única variável regionalizada de que dispomos, em invocar uma função aleatória da qual o VR seria uma realização entre uma infinidade de outras. Este é o processo fundamental de imersão probabilística que, simbolicamente, equivale a substituir por . Estamos aqui em um nível muito mais alto de abstração, e é por isso que simbolicamente o fundo é dificilmente discernível; é também por isso que aumenta consideravelmente o risco de desenvolver desenvolvimentos teóricos que na realidade nada correspondem. Mas, ao mesmo tempo, nos beneficiamos de toda a riqueza de ferramentas probabilísticas que permitem formalizar o problema inicial em termos teóricos e propor uma solução.
O estudo não deve parar por aí. Agora é apropriado expressar a resposta teórica em termos concretos. Portanto, é necessário primeiro garantir que essa resposta não dependa de nenhum parâmetro convencional e só possa ser expressa em termos de magnitudes regionais . Então, na expressão da solução teórica, é necessário substituir a função aleatória pela variável regionalizada (substituir por ): é a fase da realização , que está na base da reconstrução operativa . O resultado então fornecido deve ser comparado à realidade.
Para concluir a interpretação desta figura, deve-se notar que o usuário não possui grau de liberdade na coluna da esquerda, uma vez que a realidade é imposta a todos independentemente de quaisquer escolhas metodológicas e quaisquer preferências subjetivas; e, inversamente, quanto mais avançamos na abstração, mais possibilidades temos de fazer escolhas arbitrárias e subjetivas. Além disso, se acontecer que ao final de um trabalho os resultados propostos se revelem incompatíveis com as medidas de controle, é claro que é ao nível dos modelos que é necessário fazer as correções. Um novo ciclo deve então ser realizado: possivelmente um novo modelo primário, certamente uma nova imersão probabilística, refazendo os algoritmos e repetindo a reconstrução operativa; o principal é ter presente que, em caso de conflito entre a realidade e o modelo, é o modelo que deve estar alinhado com a realidade ...
que é um ponto de função .
O que queremos expressar ao falar de "non-point VR" é que o que é possível medir de forma eficaz no ponto não é o valor do ponto , mas sim um valor obtido por regularizar por uma certa função de ponderação. ; ou, em notações rigorosas,
ou :
No caso em que a função de ponderação constrói uma média (possivelmente ponderada), ou seja, no caso em que as variáveis e são da mesma natureza, a função é adimensional , e a escolheremos com uma integral igual a 1, portanto que e são expressos nas mesmas unidades. Por exemplo, se a regularização é a média aritmética realizada sobre um determinado domínio deslizante , a função será simplesmente, até um fator multiplicativo, a função indicadora de .
Mas pode acontecer que a regularização também descreva uma mudança na natureza, caso em que a função será expressa em unidades físicas. Assim, o campo gravitacional em um ponto é obtido pela convolução do campo de massas, em virtude da lei da gravitação : neste caso, a função é uma função isotrópica no espaço tridimensional. Neste caso, trata-se de uma função que nunca se anula, portanto, cujo suporte (no sentido matemático) é todo o espaço .
Esses dois últimos exemplos traçam uma possível ligação entre os dois significados da palavra "suporte": finalmente, o que a geoestatística chama de "suporte da RV" está na realidade conectado ao suporte (matemático) da função de ponderação que tornou possível passar da RV ocasional , experimentalmente inacessível, à função que - ela - pode ser objeto de medidas reais. Esta ambivalência de terminologia é certamente lamentável, mas é duvidoso que possa causar erros graves. Em qualquer caso, deve-se notar que o hábito perpetuou essa licença de vocabulário da comunidade geoestatística francófona.
Trata-se de uma lista, necessariamente incompleta, limitada a trabalhos resumidos (cursos ou manuais) e classificada em ordem cronológica de publicações.
Autor | Título | editor | Ano. | |
---|---|---|---|---|
Georges Matheron | Tratado sobre geoestatística aplicada , volumes 1 e 2 | (Fr) | Technip Publishing, Paris | 1962 |
Georges Matheron | Tratado de Geoestatística Aplicada , Volume 3 | (Fr) | Edições BRGM, Paris | 1962 |
Georges Matheron | Princípios de geoestatística | (dentro) | Economic Geology vol. 58 | 1963 |
Georges Matheron | Variáveis regionalizadas e sua estimativa | (Fr) | Masson, Paris | 1965 |
Jean Serra | Amostragem e estimativa local de fenômenos de transição de mineração | (Fr) | Tese de doutorado, Universidade de Nancy | 1967 |
Georges Matheron | Osnovy prikladnoy geostatistiki | (ru) | Edições Mir, Moscou | 1968 |
Daniel F. Merriam | Geoestatística | (dentro) | Plenum Press, Nova York | 1970 |
Pierre Laffitte (ed.) | Tratado de Computação Geológica | (Fr) | Masson, Paris | 1972 |
Georges Matheron | As funções aleatórias intrínsecas e suas aplicações | (dentro) | Avanços na probabilidade aplicada vol. 5 | 1973 |
Michel David | Estimativa de reserva de minério geoestatística | (dentro) | Elsevier Scientific Publishing Company, Amsterdã | 1977 |
André Journel e Charles Huijbregts | Geoestatística de mineração | (dentro) | Academic Press Inc., Londres | 1978 |
Isobel clark | Geoestatística Prática | (dentro) | Applied Science Publishers, Londres | 1979 |
Bertil Matérn | Variações espaciais | (dentro) | Springer, Berlim | 1986 |
Georges Matheron | Estimando e escolhendo | (dentro) | Springer, Berlim | 1989 |
Georges Matheron | Faça uma estimativa e escolha | (Fr) | Les Cahiers du Centre of Mathematical Morphology n o 7, Ecole des Mines de Paris | 1978 |
Rudolf Dutter | Mathematische Methoden in der Technik, Bd. 2: Geostatistik | (de) | BG Teubner Verlag, Stuttgart | 1985 |
Noel Cressie | Estatísticas para dados espaciais | (dentro) | Wiley Interscience, Nova York | 1993 |
Jean-Paul Chiles e Pierre Delfiner | Geoestatística: modelagem da incerteza espacial | (dentro) | John Wiley & Sons, Nova York | 1999 |
Christian Lantuejoul | Simulação geoestatística: modelos e algoritmos | (dentro) | Springer-Verlag, Berlim | 2002 |
Hans Wackernagel | Geoestatística multivariada | (dentro) | Springer-Verlag, Berlim | 2003 |
Pierre Chauvet | Folha de referências de geoestatística linear | (Fr) | Mines ParisTech Les Presses, Paris | 2008 |
Veja também as atas do fórum internacional em memória de Michel David, Montreal, 1993: