1. Introdução
Estudos realizados na área da Educação Matemática revelam a existência de raciocínios enviesados, erros de compreensão e aplicações intuitivas erradas nos conceitos de probabilidade, probabilidade condicionada e independência de acontecimentos (D'Amelio, 2009; Díaz, Batanero & Contreras, 2010; Díaz y de la Fuente, 2006; Fernandes, Nascimento, Cunha e Contreras, 2011; Kataoka, Trevethan & Borim da Silva, 2010; Lonjedo-Vicent, Huerta-Palau & Carles-Fariña, 2012; Sánchez, 1996; Sobreiro, 2011; entre outros). Muitas das falhas podem ser explicadas em termos semióticos (Batanero, 2005). E, embora tais falhas possam estar enraizadas pois, como Fischbein e Schnarch (1997) alerta, equívocos envolvendo raciocínio probabilístico podem permanecer com a idade do aluno, é essencial a identificação dos tipos de conflitos existentes para as superar (ex., Díaz et al., 2010).
A realização de atividades matemática envolvendo o cálculo de probabilidades representa um instrumento importante no processo de aprendizagem para promover o desenvolvimento do pensamento probabilístico (Way, 2003; Kataoka et al., 2008), proporcionar diversos tipos de conexões entre conceitos da Teoria da Probabilidade e, consequentemente, agilizar a capacidade de raciocinar e de compreender, em particular, os conceitos de probabilidade condicionada e de acontecimentos independentes. No modelo ontosemiótico do conhecimento e do Ensino da Matemática, desenvolvido por Godino e seus colaboradores nas duas últimas décadas (Godino y Batanero, 1994; Godino, 2002; Godino, Batanero & Font, 2007; Godino, Font y Wilhelmi, 2008; Godino, 2012; entre outros) visando analisar, conjuntamente, o pensamento matemático, os manifestos que o acompanham e os fatores que condicionam o seu desenvolvimento, é destacada a necessidade de uma análise detalhada da atividade matemática considerando seis tipos de entidades primárias: a linguagem (termos, expressões, notações, gráficos,...) nos seus diversos registos (escrito, oral, gestual,...); a situação- problema (aplicações extra matemáticas, exercícios, ...); os conceitos-definições (abordados através de definições ou descrições); as proposições (enunciados sobre conceitos); os procedimentos (algoritmos, operações, técnicas de cálculo,...); e os argumentos (enunciados utilizados para validar ou explicar as proposições e procedimentos, de natureza dedutiva ou outra) (Neto, 2009). Na abordagem ontosemiótica, a compreensão de qualquer conceito matemático está associado à competência do saber fazer, no sentido que cada sujeito compreende determinado objeto matemático quando o usa de maneira capaz em diferentes práticas (Godino et al., 2007). A presente investigação baseou-se nas ideias teóricas do modelo ontosemiótico como marco de referência, sendo a probabilidade condicionada e a noção de acontecimentos independentes os objectos matemáticos de interesse no modelo e de análise na perspectiva de prática matemática.
Face a situações-problema, a aplicação de diferentes processos de resolução propicia a revelação de diferentes vertentes de um mesmo conceito (Díaz y de la Fuente, 2006) e, consequentemente, de novas estratégias para fazer juízos válidos (Cunha, 2010). Do ponto de vista matemático, probabilidade condicionada e independência são definições que dependem de expressões algébricas simples, de fácil cálculo. Torna-se então fundamental conhecer as estratégias que os alunos elaboram na resolução de situações-problema (D'Amore, 2006) e as dificuldades que revelam na aplicação de definições e no estabelecimento de ligações entre elas, face a um enunciado. Recentemente, Díaz et al. (2010) sintetizou vários dos conflitos semióticos referenciados na literatura especializada dando exemplos de enunciados de problemas que poderão ajudar, alunos e professores, à tomada de consciência de raciocínios enviesados associados àqueles dois conceitos. Resumidamente, relativamente à probabilidade condicionada, podem mencionar-se:
- convicção que é mais provável a conjunção de dois acontecimentos do que cada um dos acontecimentos em separado (Tversky & Kahneman, 1983), conhecido por falácia da conjunção;
- dificuldade em distinguir os dois sentidos da probabilidade condicionada, P(A|B) e P(B|A), conhecida por falácia da condicional transposta (Falk,1986);
- dificuldade em compreender que se tome um acontecimento condicionante que ocorre depois do acontecimento condicionado, conhecida por falácia do eixo temporal (Falk,1979; Falk, 1986);
- confusão entre probabilidade condicionada, P(A|B), e probabilidade conjunta, P(A∩B), (Watson & Moritz, 2002) devida, entre outros, à não clareza da linguagem corrente utilizada no enunciado dos problemas, levantando dificuldades na sua interpretação (Falk, 1986). Por exemplo, a utilização da vírgula "," num texto verbal para descrever uma conjunção ("e") (Sobreiro, 2011);
- dificuldade em identificar o espaço amostral reduzido no cálculo de probabilidades de acontecimentos definidos por experiências compostas dadas por uma sequência temporal de experiências simples sucessivas, conhecida por situação sincrónica (Falk, 1986);
- cálculo do denominador na fórmula de Bayes (Díaz & Batanero, 2009).
Relativamente a conflitos semióticos associados à noção de independência de acontecimentos, podem mencionar-se os seguintes:
- confusão intuitiva entre as palavras "independência" e "incompatibilidade" (Cordani & Wechsler, 2006);
- dificuldade em atender o significado somente probabilístico da noção de independência (D'Amelio, 2009);
- associação da noção de independência apenas a acontecimentos independentes no tempo (Karaota et al., 2010).
Este artigo apresenta uma análise interpretativa de um estudo de caso (Ponte, 1994) centrada na compreensão dos conceitos de probabilidade condicionada, acontecimentos independentes e acontecimentos incompatíveis por alunos do 12o ano de escolaridade do ensino português. Uma análise interpretativa de dados na metodologia de um estudo de caso visa uma investigação pormenorizada de todos os dados recolhidos com vista a organizá-los e classificá-los em categorias, de modo a explorar e a explicar o fenómeno em estudo (Tesch, 1990). Neste estudo, os participantes são os alunos e os dados são os documentos escritos produzidos pelos alunos, em contexto escolar, juntos dos seus docentes titulares de turma e em momento avaliativo.
Numa primeira instância, esta investigação, inserida no paradigma descritivo, procurou quantificar os processos desenvolvidos pelos alunos na resolução de questões, exploratórias e investigativas, e em situação de avaliação escrita. Definiram-se duas escalas ordinais para medir a qualidade de cada resposta. Tomando essas medidas, avaliou-se o nível de conhecimento que os alunos demonstraram nos conceitos de probabilidade condicionada e de independência de acontecimentos e nas suas interligações com outros conceitos. Analisou-se a conexão entre o nível de desempenho e o nível de rigor, sendo este último baseado na qualidade dos procedimentos e argumentos descritos e a linguagem usada. Estudou-se ainda a importância da capacidade de interpretar e de traduzir, em termos matemáticos, o enunciado de um problema no desenvolvimento da aprendizagem dos conceitos.
Numa segunda instância, a partir de uma análise interpretativa dos conteúdos das respostas expressas pelos alunos, procurou-se tipificar as fontes de conflitos semióticos detetados nas respostas dadas pelos alunos.
2. Contextualização no ensino português
Em Portugal, o tema Probabilidades e Combinatória consta do currículo atual do 12.o ano de escolaridade. Entre os tópicos inseridos nesse tema estão probabilidade condicionada e acontecimentos independentes. Nestes conceitos, os alunos "apresentam muitas dúvidas e dificuldades, apesar da grande importância que lhes é atribuída nos Exames Nacionais e nos Testes Intermédios, uma vez que são temas constantes em todas essas provas de avaliação externa, da responsabilidade do Ministério da Educação" (Cunha, 2010, p. 28).
Watson (1995) sugere que o estudo da probabilidade condicionada deve ser introduzido desde cedo, no Ensino Básico, e trabalhado de forma intuitiva, tal como é recomendado para o ensino da Matemática em Portugal, pelo Ministério da Educação, no documento Programa de Matemática do Ensino Básico (Ponte et al., 2001).
Nos manuais escolares de Matemática para o Ensino Secundário, o conceito de probabilidade condicionada é abordado, em geral, seguindo uma definição formal mais ou menos extensível em termos de complementaridade de informação. No caso da independência de acontecimentos, o conceito é menos trabalhado, sendo que a generalidade dos manuais não realça a importância do sentido probabilístico desse conceito.
3. Abordagem metodológica
A investigação em causa insere-se numa perspetiva qualitativa, com uma abordagem interpretativa (Tesch, 1990) das respostas dadas por alunos em ambiente natural, a sala de aula, com vista a obter uma descrição e explicação de padrões cognitivos subjacentes à cada resposta dada. Baseia-se num estudo de caso, com a seleção de uma amostra intencional, com vista a captar características, tão pormenorizadas quanto possível, da ocorrência de dificuldades por parte dos participantes (Ponte, 1994). Uma análise dos documentos produzidos pelos alunos contribui para detetar diferentes processos de resolução usados, reconhecer tipos de erros, observar estratégias e avaliar o nível de conhecimento na matéria.
Colaboraram neste estudo um total de 43 alunos pertencentes a duas turmas do Ensino Regular do Curso de Ciências e Tecnologias do 12.o ano (a frente designadas por turma A e turma C) e a uma turma do Ensino Profissional do 12.o ano (a frente designa por turma B) de duas escolas secundárias diferentes do distrito do Porto (a frente designadas por E1 e E2). Para a implementação do estudo realizaram-se reuniões individuais prévias com cada um dos docentes titulares das turmas A, B e C. Foi obtida uma caracterização das suas turmas, discutido o tipo de linguagem a ser utilizada no enunciado dos problemas a propor, o tempo e o período adequado à realização da prova escrita, e a forma de recolha das respostas elaboradas pelos alunos. Foi ainda abordado o desempenho expectável de cada turma, bem como a ênfase dada nas aulas aos tópicos probabilidade condicionada e acontecimentos independentes. Foi referido que a linguagem, procedimentos e argumentos considerados no processo de ensino daqueles conceitos está conforme o previsto no documento Programa de Matemática do Ensino Básico, Ponte e outros (2001).
Da turma A, constituída por 24 alunos, participaram nesta investigação 20 (os restantes não deram autorização para divulgar os seus resultados). Estes eram 9 do sexo feminino e 11 do sexo masculino, todos dentro da escolaridade obrigatória e com média de idade igual a 16,5 anos. Nenhum aluno desta turma usufruiu de apoio educativo no ano anterior. Todos os alunos revelaram gostar da escola. A docente de Matemática da turma A é efetiva na escola E1, com larga experiência na lecionação do 12.o ano, tendo acompanhado os seus alunos desde o Ensino Básico (7.o ano), pelo que conhece muito bem o trabalho individual destes. A turma B é constituída por 14 alunos, 6 do sexo feminino e 8 do sexo masculino. Todos os alunos estão dentro da escolaridade obrigatória à exceção de um aluno. A média de idades é de 16,8 anos. A turma C é constituída por 9 alunos, todos do sexo masculino. Apenas 5 alunos estão dentro da escolaridade obrigatória. A média de idades é de 17,6 anos. As docentes de Matemática das turmas B e C são efetivas na Escola E2 e com uma larga experiência de lecionação do 12.o ano. Estas docentes também têm acompanhado há muito tempo os seus alunos, não tendo sido referido na entrevista desde quando o fazem.
A turma A pode ser considerada como uma turma de "elite", com alunos maioritariamente com interesse em prosseguir estudos a nível universitário, e distinta da turma C, com alguns alunos não interessados em seguir estudos a nível superior (politécnico ou universitário), e da turma B, com alunos que, não colocando de lado a prossecução de estudos superiores, optaram por um ensino secundário menos académico.
Foi elaborado o enunciado de dois problemas (designados a frente por P1 e P2), a implementar numa prova de avaliação, para os alunos das turmas A, B e C. Os problemas foram inspirados nos manuais escolares adotados nas escolas E1 e E2. Para a construção final do enunciado de P1 e P2 (em Apêndices 1 e 2) foram tidas em conta as ferramentas conceptuais do enfoque ontosemiótico, propostas por Godino et al. (2007) como sejam a linguagem, os conceitos, as propriedades, os procedimentos, as conjeturas e os argumentos ligados aos conceitos base de probabilidade condicionada e de independência, tendo como suporte uma análise sistemática de possíveis resoluções às situação-problemas propostas. Leitores interessados em detalhes dos objetos e relações primárias que intervêm na solução de cada uma das situação-problemas podem consultar Carvalho (2013).
Os professores de Matemática das turmas A, B e C analisaram os problemas e, após ligeiras adaptações, declararam que o enunciado, na sua versão final (ver Apêndices 1 e 2), estava adequado em termos de conteúdo programático, linguagem usada e nível de dificuldade. Porém, a docente da turma B solicitou a substituição da designação do acontecimento P por B no problema P2, já que os alunos estavam menos familiarizados com a letra P para designar um acontecimento. Esta alteração foi apenas considerada para a turma B.
Previamente foi ainda solicitado a um estudante do 12.o ano, que não pertencia a nenhuma das escolas envolvidas, que realizasse a prova em regime experimental. Este estudante afirmou tratar-se de uma prova acessível e com linguagem clara e objetiva.
Ambos os problemas, P1 e P2, abordam os conceitos de probabilidade condicionada e de acontecimentos independentes, usando a linguagem verbal e simbólica. Em P1 há 7 alíneas e em P2 há 5 alíneas, de acordo com a distribuição sumária descrita na Tabela 1. A noção de independência é abordada sequencialmente e relacionada com a noção de incompatibilidade, para diferentes situações conforme é indicado na Tabela 2. Em P1, os dados do enunciado encontram-se previamente estruturados numa linguagem mais próxima da linguagem simbólica, sendo estes fornecidos na forma de uma tabela de dupla entrada. Em P2, os dados são descritos em linguagem apenas verbal.
Os dados para análise corresponderam às respostas escritas dos 43 alunos das turmas A, B e C, em momento avaliativo, às 12 questões da prova. A recolha dos dados foi realizada em dezembro de 2012, data em que os alunos concluíram o estudo do tema Probabilidades e Combinatória. O acesso à prova elaborada por cada aluno, autorizado pelos professores de Matemática das turmas A, B e C, foi antes destas terem sido cotadas pelos respetivos professores. A identificação do aluno foi eliminada e atribuído um numeral a cada prova. As cópias das provas foram guardadas em suporte digital, para posterior análise. Por questões legais e éticas, foi previamente solicitada autorização para a realização da experiência, a recolha dos dados e a publicitação dos resultados às direções das escolas participantes e aos encarregados de educação dos alunos envolvidos no estudo.
Numa primeira parte, a investigação teve um carácter essencialmente qualitativo com a análise das respostas recolhidas, de modo a caracterizar, em termos descritivos, o seu conteúdo. Para uma descrição de cada resposta, procedeu-se de seguida, a uma análise de conteúdo e de interpretação de raciocínios subjacente à resposta, tendo por base comparativa a resposta correta expectável. Essa análise comparativa permitiu a categorização de cada resposta e, consequentemente, o agrupamento de respostas por classes de respostas similares em termos de qualidade.
Díaz e Batanero (2009) propuseram estabelecer uma correspondência entre a qualidade das respostas dos alunos e um numeral entre 0 a 2 do seguinte modo: não resposta ou resposta errada é representada por 0; resposta parcialmente correta é representada por 1; solução correta é representada por 2. No presente estudo propõe-se estender aquela categorização e dividir a apreciação da qualidade das respostas segundo duas perspetivas qualitativas ordinais distintas: o grau de desempenho da resposta (GD) e grau de rigor (GR). O desempenho diz respeito à capacidade da resposta conter a solução e referência dos pontos chaves para chegar ao resultado pretendido na pergunta. O rigor diz respeito à capacidade argumentativa e à linguagem apresentada na resposta escrita.
Para incorporar a ausência de resposta e dar maior detalhe à qualidade da resposta dada, caso exista, o parâmetro GD foi distribuído segundo a seguinte escala ordinal: ausência de resposta é representada pelo numeral 0; resposta totalmente errada é representada por 1; resposta parcialmente errada é representada por 2; resposta com início de uma estratégia que é abandonada ou concluída de forma errada é representada por 3; resposta parcialmente certa ou certa mas com passos omissos é representada por 4; por fim, resposta totalmente certa com indicação dos passos chaves correto é representada pelo numeral 5.
No que concerne ao grau de rigor (GR), foi escolhida uma escala de Likert, variando de 0 a 3 e parâmetros de uniformização de critérios descritos na Tabela 3. Para cada resposta, o valor atribuído para GR corresponde àquele que cumpre o maior conjunto de indicadores. A opção de um número par de correspondências alternativas obriga a atribuir uma opção definitivamente positiva ou negativa, já que não é possível optar por uma atitude neutra por esta não existir.
A necessidade de proceder a extensões das três categorias propostas em Díaz e Batanero (2009) para as escalas definidas pelo GD e GR está intimamente relacionada com a natureza diversa das turmas A, B e C (Ensino Regular e Ensino Profissional) consideradas neste estudo. Efectivamente, do conhecimento empírico da primeira autora, é previsível a existência de tendência dos alunos do Ensino Profissional não explicitarem / argumentarem o seu raciocínio nas respostas. Com esta divisão proposta de GD e GR, prevê-se que traços diferenciadores, ao nível do desempenho e do rigor, poderão ser detetadas.
4. Análise das respostas dadas
Em termos de procedimento, observa-se que cerca de 50% dos alunos traduzem, em termos explícitos e antes de responder às questões, os dados do enunciado de um problema em linguagem simbólica, quer com recurso a um diagrama de árvore, tabela de dupla entrada ou outro esquema. Esta tendência de não estruturar ou formular, em termos matemáticos, a linguagem textual de um enunciado, é particularmente notória na turma B. Esta característica é relevante já que pode reflectir a incapacidade de interpretar e obter corretamente os dados do enunciado.
Em termos de justificações, os argumentos redigidos foram de natureza dedutiva baseados em síntese de cálculos realizados e propriedades dos conceitos. Várias vezes o rigor demonstrado nos cálculos nem sempre foi coerente com a explanação escrita e, outras vezes, foi traduzido não rigorosamente por palavras o que representavam os cálculos realizados. Em particular, os alunos do Ensino Profissional (turma B) apresentaram maior dificuldade em expressar um raciocínio argumentativo coeso e coerente com os resultados obtidos.
4.1. Nível de desempenho e Nível de rigor
Analisadas as respostas e raciocínios apresentados pelos 43 alunos a cada uma das perguntas dos problemas P1 e P2, avaliou-se a qualidade de cada resposta em termos do grau de desempenho (GD) e do grau de rigor (GR). Considerando as 3 turmas em conjunto, 70% dos alunos envolvidos (todos os alunos da turma A, 1 na turma B e 9 na turma C) obtiveram desempenho positivo com soma dos GD, das 12 alíneas contidas nos dois problemas, igual ou superior a metade do valor máximo possível (60). No que concerne ao rigor das respostas corretas, constata- se que uma resposta certa não é geralmente acompanhada de uma linguagem e argumentação de nível elevado. A percentagem de alunos com soma dos GR, das 12 alíneas respondidas corretamente, igual ou superior a metade do valor máximo possível (36), baixa para 42% (14 da turma A, 0 na turma B e 4 na turma C).
Na Figura 1 encontram-se a distribuição dos valores correspondentes aos atributos (ordinais) das escalas GD e GR obtidos. Da Figura 1 conclui-se que as 3 turmas apresentam comportamentos diferentes em termos de desempenho e rigor nas respostas dadas pelos alunos. Tomando os valores medianos do GD, para cada uma das questões e por turma, observa-se que a turma A apresenta o melhor grau de desempenho, na maioria das questões, e a turma B os piores. Relativamente ao GR, em termos medianos, a turma A apresenta respostas com maior nível de rigor e a turma B os mais baixos. Estes resultados vão de acordo com o sentir dos docentes, no terreno, ao afirmarem que os alunos do Ensino Profissional não apresentam os melhores resultados. Mas tal não significa a não existência de casos pontuais.
Os valores atípicos assinalados na Figura 1, em maior quantidade no conjunto dos valores de GD, mostram a existência de alunos da turma B com níveis de desempenho superiores ao padrão da turma (definido, na Figura 1, pela caixa com os bigodes) em oposição à existência de alunos da turma A com níveis de desempenho abaixo do padrão distribucional da turma A. Analisando os valores mais centrais (amplitudes interquartis, Figura 1), observam-se, em geral, maiores amplitudes das caixas de bigodes para o GD na turma C comparativamente com a turma A (menos evidente no GR). Tal evidencia maior heterogeneidade de desempenho nas respostas dadas pelos alunos da turma C. Este facto leva a especular se esta constatação estará relacionada com a menor e maior diversidade de interesse académico futuro conhecido dos alunos das turmas A e C, respectivamente.
Centrando a atenção na linguagem, constata-se que nas resoluções apresentadas, os alunos privilegiaram o uso da linguagem verbal para representar os acontecimentos e a linguagem simbólica para identificar do tipo de probabilidade pedida ou averiguar da independência e incompatibilidade de acontecimentos. Enfatizando ainda a diferença na linguagem dos enunciados dos dois problemas, linguagem simbólica (P1) versus linguagem verbal (P2), refira-se que cerca de metade dos alunos envolvidos traduzem em linguagem simbólica os dados do enunciado do problema P2 antes de resolvê-la.
Confrontado o número de questões não respondidas entre os problemas P1 e P2 (Figura 2), observa-se tendência para se registar pior comportamento (i.e., não apresentar qualquer resposta) em questões do problema P2, em particular, nas turmas B e C, e menor tendência em deixar questões em branco por parte dos alunos da turma A.
Comparando as medianas dos valores observados para o GD e o GR entre as questões do problema P1 e P2 (Figura 1), observa-se valores medianos do GD máximos para as turmas do Ensino Regular (turmas A e C) e mais elevados para as respostas ao problema P1. Calculando a mediana dos valores de GD das respostas às questões do problema P1 e do P2 (Tabela 4), constata-se desempenho mediano melhor nas respostas dadas ao problema P1 do que ao problema P2, nas turmas B e C. Igual desempenho mediano nos problemas P1 e P2 foi observado na turma A. Estes factos sugerem que a turma A demonstra menor dificuldade em formular matematicamente o enunciado do problema P2, contrariamente às outras duas turmas. Avaliando globalmente o nível de desempenho dos alunos das três turmas em conjunto (Tabela 4, última linha), claramente no problema P2 o GD mediano é menor: pelo menos metade dos alunos apresentam em P2 um GD não superior a 2, em oposição ao problema P1 onde o nível máximo 5 é atingido em pelo menos 50% dos 43 alunos. Relativamente ao GR (Figura 1, em baixo, e Tabela 4), constata-se uma distribuição do nível de rigor mediano similar em ambos os problemas nas turmas A e B. Contudo, é a turma A que apresenta maior grau de rigor, em termos medianos, o que significa uma melhor qualidade de argumentação e de linguagem na resposta correta dadas pelos alunos daquela turma nos dois problemas. Globalmente (Tabela 4, última linha), é em P2 onde se observa menor rigor mediano com pelo menos metade dos alunos a responder com um GR não superior a 1. Esta sumarização de comportamento denuncia que a utilização da linguagem verbal no enunciado dos dados de um problema pode influenciar negativamente a prestação global e, por inerência, a qualidade de respostas de alunos menos bem preparados. O facto da turma A demonstrar similar desempenho nos problemas P1 e P2 está em concordância com a indicação dada pela docente titular da turma A de estar ser uma turma com alunos, em geral, bastante empenhados.
Para avaliar o nível de conhecimento nos conceitos de probabilidade condicionada e de independência (e incompatibilidade), calcularam-se os valores medianos do GD e do GR das respostas ao grupo das questões mais subjacentes ao conceito de probabilidade condicionada, questões 1.1, 1.2., 1.3, 2.1 e 2.4, e ao grupo das questões mais subjacentes ao conceito de independência e incompatibilidade, questões 1.4, 2.2 e 2.3 (Tabela 5). Relativamente ao GD, as 3 turmas apresentam, em termos medianos, a mesma qualidade de desempenho, nas respostas para as questões sobre probabilidade condicionada e para as questões sobre acontecimentos independentes e incompatíveis. Relativamente ao GR avaliado nas respostas corretas, nota-se, quer nas turmas A e C quer nas três turmas em conjunto e em termos medianos, um menor rigor nas respostas dadas às questões propostas sobre acontecimentos independentes e incompatíveis. Tal facto pode indiciar um menor à vontade dos alunos em explicar os resultados que envolvem daqueles dois conceitos.
Para averiguar o nível de associação entre as pontuações correspondentes aos atrib2utos (ordinais) das escalas GD e GR obtidos em cada questão, considerou-se o coeficiente de correlação de Spearman (valores sumariados na Figura 3). A escolha deste coeficiente justifica-se por GD e GR serem medidas ordinais. O nível de correlação observado para cada questão é superior a 0,5, sendo o nível médio de correlação para o grupo de questões envolvendo probabilidade condicional e o grupo de questões envolvendo acontecimentos independentes igual a 0,77, para ambos os grupos. Tal significa que uma melhor qualidade de desempenho de uma resposta de ambos os tópicos, em média, vem acompanhada de um maior nível de rigor.
4.2. Tipos de conflitos
Por observação de todas as resoluções com 0<GD<5 e 0<GR<3 entre os 43 alunos, conseguiu-se tipificar as fontes principais de erros que emergem das respostas incorretas em 3 grandes classes:
C1 - conflitos na interpretação e cálculo da probabilidade condicionada;
C2 - Propriedades incorrectas associadas à noção de independência;
C3 - Propriedades incorrectas associadas à noção de incompatibilidade.
De seguida apresenta-se uma análise mais detalhada dos conflitos semióticos observados em cada classe.
4.2.1. Conflitos na interpretação e cálculo da probabilidade condicionada
Os conflitos inseridos na classe C1 correspondem a confusões de interpretação, num texto verbal, entre probabilidade condicionada e probabilidade conjunta e a dificuldades em delinear os passos essenciais corretos para o cálculo do denominador na fórmula da probabilidade condicionada (i.e., aplicar correctamente a lei da probabilidade total). Das respostas observadas evidencia- se ser a classe C1 a que origina mais respostas não corretas: 65% dos alunos apresentam pelo menos uma resposta com interpretação não correta dos dados do enunciado; 53% revela conflito no processo de cálculo de probabilidades condicionadas. O conflito atribuído à interpretação torna-se particularmente prejudicial pois origina a propagação de mais dificuldades como seja a incapacidade de estruturar, corretamente, em linguagem simbólica ou por tabela, os dados descritos em linguagem natural conduzindo assim a uma formulação matemática errada do enunciado.
Na Figura 4 são ilustrados alguns casos observados de conflitos de interpretação da probabilidade condicionada inseridos na classe C1. A Figura 4.a. contém um excerto da resposta do aluno 19 da turma A, à questão 1.3, que interpreta erradamente os textos "Probabilidade de ser confirmado, no nascimento, que o bebé da Sra. Ana é do sexo feminino" e "Probabilidade de ser confirmado, no nascimento, que o bebé da Sra. Berta é do sexo masculino" para uma probabilidade conjunta. As Figuras 4.b. e 4.c. mostram as respostas erradas do aluno 8 da turma B, à questão 1.2, e do aluno 1 da turma C, à questão 2.1, respetivamente, ao terem traduzido para probabilidade da intersecção um texto com enunciado tipicamente de probabilidade condicionada, no primeiro caso, da forma "probabilidade de... [A]... se ...[B]" e, no segundo caso, da forma "probabilidade de...[A]... sabendo que ...[B] ". Em ambos os textos está claramente explícito ser [B] o acontecimento condicionante. Estes casos denunciam a inoperância do aluno de, face a um enunciado, averiguar se existe algum fenómeno ou acontecimento que restrinja o espaço amostral. Esta incapacidade sugere alguma imaturidade científica resultante da falta de informação ou de treino sobre enunciados tipicamente associados a probabilidades condicionadas, como os mencionados acima.
Na Figura 5 estão transpostos alguns casos observados de conflitos de cálculo da probabilidade condicionada inseridos na classe C1. A Figura 5.a. ilustra uma resposta sem erros, do aluno 19 da turma A à questão 2.1, mas inacabada por falta do cálculo da probabilidade do acontecimento condicionante na fórmula da probabilidade condicionada. A Figura 5.b. mostra a estratégia da resposta do aluno 5 da turma C, na questão 2.1, de impor erradamente a independência de dois acontecimentos para obter um valor para o denominador na fórmula da probabilidade condicionada.
4.2.2. Propriedades incorrectas associadas à noção de independência
Dentro da classe C2 incluem-se essencialmente dois tipos de conflitos, ambos derivados do estabelecimento de conexões erróneas, um com a noção de incompatibilidade e outro com a designação de acontecimentos incompatíveis. Enquanto o primeiro, mais grave, é fruto do aluno ainda não ter compreendido a noção probabilística associada ao conceito de independência confundindo-a com a noção de incompatibilidade, o segundo tipo realça a existência de similaridade nos termos incompatibilidade e independência, conduzindo à troca das designações em situação de stress, natural em momentos avaliativos. Para ambos os tipos registaram-se cerca de 30% dos alunos com pelo menos uma resposta nessas condições. Na Figura 6 apresentam-se dois exemplos do primeiro tipo, com as respostas dadas pelo aluno 11, da turma C, e aluno 10, da turma A, à questão 1.4.b. Na Figura 7 apresentam-se dois exemplos do segundo tipo de erro com as respostas do aluno 17, da turma A, à questão 2.3 e do aluno 15, da turma A, à questão 1.4.b.
4.2.3. Propriedades incorrectas associadas à noção de incompatibilidade
As resoluções das questões envolvendo o conceito de incompatibilidade (alíneas 1.4.c e 2.2) revelam que, em geral, os alunos compreendem o conceito de acontecimentos incompatíveis e justificam a incompatibilidade recorrendo, não à definição, mas somente à condição necessária da probabilidade da intersecção de acontecimentos incompatíveis ser nula. A verificação, apenas, desta condição necessária não é garantia dos acontecimentos serem incompatíveis. Já a sua não verificação é garantia dos acontecimentos não serem incompatíveis. Este jogo de raciocínio lógico envolvendo a condição necessária, mas não suficiente, de incompatibilidade leva à existência de conflitos na noção de incompatibilidade que definem a classe C3. Contabilizaram-se cerca de 20% dos alunos com pelo menos uma resposta com este tipo de conflito. Na Figura 8 estão dois exemplos de respostas observadas com argumentos errados inseridos na classe C3. A Figura 8.a. ilustra a resposta do aluno 1, da turma A, à questão 1.4.c., que recorre ao cálculo da probabilidade da intersecção para concluir a incompatibilidade. A Figura 8.b. revela a resposta do aluno 14, da turma C, à questão 2.2, onde confunde o numeral zero com o conjunto vazio (acontecimento impossível).
5. Conclusões
A realização de uma situação-problema motiva a abordagem de conceitos, propriedades e procedimentos, quer o aluno tenha já trabalhado nessa temática ou não, propiciando um amaduramento científico dos conceitos e propriedades. O domínio cognitivo dos conceitos e propriedades é aperfeiçoado nos procedimentos aplicados facilitando a fundamentação e a argumentação. Por seu turno, os argumentos a usar numa resposta determinam o procedimento a adoptar. Esta espiral de crescimento cognitivo expectável entre domínio, procedimento e argumentação, incentiva a realização de atividades matemática baseadas em situações-problema.
Na presente investigação são analisadas em paralelo duas escalas ordinais, GD e GR, a respostas dadas a duas situações problemas, P1 e P2, para avaliar o nível de conhecimento sobre tópicos concretos da Teoria da Probabilidade leccionado actualmente no 12o ano de escolaridade em Portugal. Ambas as situações-problema propostas, P1 e P2, envolviam os tópicos de probabilidade condicionada, acontecimentos independentes e acontecimentos incompatíveis. Contudo, em P1 os dados encontravam-se esquematizados numa tabela de dupla entrada, enquanto em P2 os dados estavam descritos na forma de texto, o que exigia a sua formulação matemática por parte do aluno.
Para um grupo investigado de 43 alunos do 12.o ano, verifica-se que o nível de conhecimento em probabilidade condicionada e independência de acontecimentos, medido em termos de GD e GR está intrinsecamente associado à qualidade (alta, média ou baixa) de estudo do estudante. As respostas com melhor qualidade foram de alunos da turma A (turma de "elite") e as piores foram de alunos da turma B (do Ensino Profissional). Na realidade, é na turma com os melhores alunos que se encontram respostas com melhor desempenho e, simultaneamente, mais rigorosas. Estes resultados levam a crer que o nível de conhecimento nos conceitos de probabilidade condicionada e de acontecimentos independentes está dependente da motivação e facilidade de aprendizagem do aluno, entendendo-se que, como atualmente se crê, os alunos do Ensino Profissional estão menos motivados para continuação de estudos a nível superior e apresentam mais dificuldade para o estudo.
Em termos medianos, constata-se que o nível de conhecimento entre os dois conceitos não difere quando avaliado em função da capacidade do aluno de obter o resultado certo (GD) para questões envolvendo probabilidade condicionada e acontecimentos independentes. Porém, as respostas são mais rigorosas (i.e., GR maior) quando aborda a probabilidade condicionada. Assim, os resultados obtidos levam a conjeturar que existe um menor à vontade por parte do aluno no conceito de acontecimentos independentes e incompatibilidade.
Da análise dos graus de desempenho e de rigor por tipo de problema (com e sem esquematização dos dados do enunciado), é evidente que a facilidade de interpretação do problema condiciona a qualidade da resposta. Os alunos com maior nível de conhecimento (turma A) não demonstraram dificuldade de interpretação do problema sendo capazes de formular matematicamente um enunciado, contrariamente aos outros alunos.
Relacionando o grau de desempenho e o grau de rigor de uma resposta, constatou-se que nem sempre uma resposta correta é acompanhada pelo rigor na sua elaboração; porém, uma resposta com maior qualidade de desempenho, em média, vem acompanhada de maior rigor em termos de procedimento, argumento e/ou linguagem usada. Tal característica é comum para questões sobre probabilidade condicionada e sobre independência.
A análise do grupo das respostas dadas pelos 43 alunos sugere a existência de 3 classes, C1 (conflitos na interpretação e cálculo da probabilidade condicionada), C2 (conflitos na noção de independência) e C3 (conflitos na noção de incompatibilidade), como fonte primária de conflitos semióticos em situações-problema envolvendo os conceitos de probabilidade condicionada e independência de acontecimentos. A existência destas classes de conflitos revela a necessidade de se aprofundar tais conceitos em contexto escolar. Em resumo, as recomendações emergentes do estudo apontam para uma maior prática na formulação matemática de enunciados envolvendo probabilidade condicionada e um maior ênfase no caracter probabilístico associado à noção de independência em oposição à noção de incompatibilidade. Concretamente, o presente caso de estudo mostra a necessidade de se exercitar na tradução de problemas com linguagem verbal para linguagem simbólica, em particular, de textos tipicamente sobre probabilidade condicionada como sejam, por exemplo, "probabilidade de... [A]... se ...[B]", "probabilidade de...[A]... sabendo que ...[B]" e "probabilidade de em [B] ocorrer [A]". O objectivo é instruir os estudantes a captarem, num enunciado, se existe fenómeno que restrinja o espaço amostral e assim identificar o acontecimento condicionante. Mais ainda, esta investigação salienta a necessidade de se reforçar que o cálculo ou referência às probabilidades são fundamentais para justificar a independência de acontecimentos, podendo ser usados para justificar a não incompatibilidade mas não para justificar a incompatibilidade.
6. Considerações finais
Este trabalho, que resulta da investigação realizada para a dissertação de Carvalho (2013), confirma resultados de outros estudos e fornece novos elementos para a investigação do Ensino da Matemática. O caracter inovador prende-se com a proposta de usar, em paralelo, duas medidas ordinais, em escala de Likert, GD e GR, para quantificar a qualidade de uma resposta em termos do seu desempenho e rigor.
Nas temáticas probabilidade condicionada e independência, os tipos de conflitos semióticos listados nas classes C1, C2 e C3 encontram-se bem documentados, com maior ou menos ênfase, em literatura especializada. Contudo, o presente caso de estudo permitiu confirmar que em Portugal esses tipos de conflitos persistem, demonstrando a necessidade de se criarem acções de formação que visem consciencializar atempadamente o professor da existência daqueles conf litos.