Bancos de dados sociolinguísticos e a Ciência Aberta
compartilhamento de dados e conhecimentos
Palavras-chave:
Ciência Aberta; , Bancos de dados sociolinguísticos;Resumo
Bancos de dados sociolinguísticos têm sido fonte de referência para a descrição das diferentes variedades do português brasileiro e oferecido subsídios para outras funções sociais. Contudo, o conhecimento produzido pela Sociolinguística Variacionista não tem recebido a visibilidade no cenário brasileiro, assim como argumentado por Labov (2020) acerca das contribuições da sociolinguística nos Estados Unidos. Constatamos isso por meio de exemplos mecanicistas em livros didáticos da variação de sentido no ensino da língua portuguesa, bem como a visibilidade de “linguistas da internet” que propagam o preconceito linguístico. Assim, apresentamos, neste texto, uma reflexão sobre como a adoção de alguns preceitos de Ciência Aberta podem contribuir para o fortalecimento da área frente a sociedade brasileira.
Referências
ARAÚJO, A. A. o projeto norma oral do português popular de fortaleza NORPOFOR. In: XV CONGRESSO NACIONAL DE LINGUÍSTICA E FILOLOGIA, v. 15, n. 5, 2011, Rio de Janeiro. Anais [...] Rio de Janeiro: CiFEFiL, 2011. p. 835-845. Disponível em: https://url.gratis/h5Lgdm. Acesso em: 23 ago. 2019.
ARAUJO, S. S. F.; ALMEIDA, N. L. F. O Projeto A língua portuguesa no semiárido baiano – Fase 3: critérios de constituição e da amostragem do banco de dados. In: FREITAG, R. M. KO. (Org.). Metodologia de Coleta e Manipulação de Dados em Sociolinguística. São Paulo: Blücher, 2014. p. 27-48. Disponível em: https://url.gratis/fUwn0w. Acesso em: 05 ago. 2020.
ALUÍSIO, S., PELIZZONI, J., MARCHI, A.R., DE OLIVEIRA, L., MANENTI, R., MARQUIAFÁVEL, V. 2003. An Account of the Challenge of Tagging a Reference Corpus for Brazilian Portuguese. In: Proceedings of the 6th International Conference on Computational Processing of the Portuguese Language (PROPOR). Proceedings […] PROPOR, 2003.
BAILEY, G.; TILLERY, J. Some Sources of Divergent Data in Sociolinguistics. In: FOUGHT, C. (Ed.) Sociolinguistic Variation: Critical Reflections. Nova Iorque: Oxford University Press, 2004. p. 11-30.
BICK. E. The Parsing System “Palavras”. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Tese (Doutorado) - Departamento de Linguística, Universidade de Aarhus, 2000.
BRASIL. Ministério da Educação. Edital de convocação Nº 01/2021 – CGPLI. [EDITAL DE CONVOCAÇÃO PARA O PROCESSO DE INSCRIÇÃO E AVALIAÇÃO DE OBRAS DIDÁTICAS, LITERÁRIAS E PEDAGÓGICAS PARA O PROGRAMA NACIONAL DO LIVRO E DO MATERIAL DIDÁTICO - PNLD 2023. Diário Oficial da União, seção 3, Brasília, DF, n. 30, p. 47, 12 fev 2021.
BRASIL. Base Nacional Comum Curricular. Brasília: MEC, 2017.
BRASIL. Parâmetros Curriculares Nacionais: Terceiro e quarto ciclos do ensino fundamental. Língua Portuguesa. Brasília: MEC, 1998.
BURKE, M.; CHELLIAH, S. L. Challenges to Representing Personal Names and Language Names in Language Archives: Examples from Northeast India. In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021. p. 44-46. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.
CALAMAI, S. FRONTINI, F. FAIR data principles and their application to speech and oral archives. Journal of New Music Research, v. 47, n. 4, 339–354, 2018. Disponível em: https://www.tandfonline.com/doi/full/10.1080/09298215.2018.1473449?scroll=top&needAccess=true. Acesso em: 30 jun. 2020.
CARVALHO, A. M. Corpus del Español en el Sur de Arizona (CESA). University of Arizona. 2012. Disponível em: cesa.arizona.edu. Acesso em: 12 set. 2020.
CASTILHO, A. T. Gramática do português brasileiro: fundamentos, perspectivas. Cadernos de Linguística, v. 2, n. 1, p. 01-17, 2021. Disponível em: https://cadernos.abralin.org/index.php/cadernos/article/view/252. Acesso em 08 out. 2021.
CESARINO, L. Pós-verdade e a crise do sistema de peritos: uma explicação cibernética. Ilha Revista de Antropologia, v. 23, n. 1, p. 73-96, 2021. Disponível em: https://periodicos.ufsc.br/index.php/ilha/article/view/75630. Acesso em: 16 mar. 2023.
COLLISCHONN, G.; MONARETTO, V. O. Banco de dados V ARSUL: a relevância de suas características e a abrangência de seus resultados. ALFA: Revista de Linguística, v.56, n.3, p. 835-853, 2012. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/4953. Acesso em: 20 abr. 2019.
FIDLER, F.; WILCOX, J. Reproducibility of Scientific Results. In: ZALTA, E. N. (Ed.) The Stanford Encyclopedia of Philosophy. Disponível em: https://plato.stanford.edu/archives/win2018/entries/scientific-reproducibility/. Acesso em: 08 jul. 2019.
FREITAG, R. M. K., Linguistic Repositories as Asset: Challenges for Sociolinguistic Approach in Brazil. In: In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021b. p. 33-35. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.
FREITAG, R. M. K. Amostras sociolinguísticas: probabilísticas ou por conveniência? Revista de Estudos da Linguagem, v. 26, n. 2, p. 667-686, 2018. Disponível em: http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/12412/0. Acesso em: 10 set. 2021.
FREITAG, R. M. K. Documentação sociolinguística: coleta de dados e ética em pesquisa. São Cristóvão: Editora UFS, 2017a Disponível em: https://www.livraria.ufs.br/produto/documentacao-sociolinguistica-coleta-de-dados-e-etica-em-pesquisa/. Acesso em: 10 jun. 2020.
FREITAG, R. M.K. A dadidade (ou dadidão) do dado, Linguística Rio, v.3, n.1, p.1-10, 2017b
FREITAG, R. M. K. Sociolinguística no/do Brasil. Cadernos de Estudos Linguísticos, v. 58, n. 3, p. 445-460, 2016.
FREITAG, R. M. K.; MARTINS, M. A.; TAVARES, M. A. FREITAG, R. M. K.; MARTINS, M. A.; TAVARES, M. A. Banco de dados sociolinguísticos do português brasileiro e os estudos de terceira onda: Potencialidades e limites. ALFA: Revista de Linguística, v.56, n.3, p. 917-944, 2012. Disponível em: https://www.scielo.br/pdf/alfa/v56n3/a09v56n3. Acesso em: 16 set. 2020.
FREITAG, R. M. K.; ROST SNICHELOTTO, C. A. Análises contrastivas: estabilidade, variedade ou metodologia?. Working Papers em Linguística, v. 16, n. 1, p. 157-167, 2015. Disponível em: https://periodicos.ufsc.br/index.php/workingpapers/article/view/1984-8420.2015v16n1p157. Acesso em 01 dez 2021.
FREITAG, R. M. K.; SANTANA, C. C.; ANDRADE, T. R. C. Práticas constitutivas do povoado Açuzinho. Revista Ambivalências, v. 2, n. 3, p.194-217, 2014. Disponível em: https://seer.ufs.br/index.php/Ambivalencias/article/view/3129. Acesso 12 set. 2021.
GALVES, C.; ANDRADE, A. L.; FARIA, P. Tycho Brahe Parsed Corpus of Historical Portuguese. 2017.
GARELLEK, M. et al. Toward open data policies in phonetics: What we can gain and how we can avoid pitfalls. Journal of Speech Science, v. 9, n. 1, p.3-16, 2020. Disponível em: https://halshs.archives-ouvertes.fr/halshs-02894375/. Acesso em: 01 jun. 2021.
GONÇALVES, S. C. L. Projeto ALIP (Amostra Linguística do Interior Paulista) e banco de dados Iboruna: 10 anos de contribuição com a descrição do português brasileiro. Estudos Linguísticos, v. 48, n. 1, p. 276-29, abr. 2019. Disponível em: https://revistas.gel.org.br/estudos-linguisticos/article/view/2430/1503. Aceso em: 25 abr. 2019.
GILMORE, R.; KENNEDY, J. L.; ADOLPH, K. E. Practical solutions for sharing data and materials from psychological research. Adv Methods Pract Psychol Sci, v. 1, n. 1, p. 121-130, 2018. Disponível em: https://journals.sagepub.com/doi/full/10.1177/2515245917746500. Acesso em: 01 jun. 2021.
JUSTICE as a linguistic matter. Conferência apresentada por William Labov. [s.l., s.n], 2020. 1 vídeo (1h 06min 33s). Publicado pelo canal da Associação Brasileira de Linguística. Disponível em: https://www.youtube.com/watch?v=cr5tyw8_gT0&t=2231s. Acesso em: 23 mai. 2020.
KENDALL, T. Data in the Study of Variation and Change. CHAMBERS, J. K.; SCHILLING, N. (Eds.). The handbook of language variation and change. 2ª Ed. Malden: Wiley-Blackwell, 2013. p. 38-56.
KENDALL, T. On the History and Future of Sociolinguistic Data. Language and Linguistics Compass, v. 2, n. 2, p. 332-351, 2008. Disponível em: https://onlinelibrary.wiley.com/doi/10.1111/j.1749-818X.2008.00051.xAcesso em 20 mai. 2019.
KENDALL, T.; FRENCH, A. Digital Audio Archives, Computer-Enhanced Transcripts, and New Methods in Sociolinguistic Analysis. Digital Humanities, Paris, Jul., p. 110-112, 2006. Disponível em: https://slaap.chass.ncsu.edu/pdfs/DH2006_pp110-112.pdf. Acesso em: 20 mai. 2019.
LABOV, W. Padrões sociolinguísticos. Trad. Marcos Bagno, Maria Marta Pereira Scherre, Caroline Rodrigues Cardoso. São Paulo: Parábola Editorial, 2008. [1972]
LABOV, W. The social stratification of English in New York city. Cambridge University Press, 2006. [1966]
LABOV, W. Principles of linguistic change: Social factors. Malden: Blackwell, 2001. v.2
LABOV, W. Contraction, deletion, and inherent variability of the English copula. Language, v. 45, n. 4, p. 715-762, 1969. Disponível em: https://www.jstor.org/stable/412333. Acesso em: 13 jul. 2021.
LABOV, W. Field methods of the project on linguistic change and variation. Sociolinguistic working paper, n.81, p. 1- 43, 1981. Disponível em: https://eric.ed.gov/?id=ED250938. Acesso em: 13 jul. 2021.
MACHADO VIEIRA, M. S. et. al. Plataforma da Diversidade Linguística Brasileira. Projeto apresentado à Pró-Reitoria de Pós-Graduação e Pesquisa da UFRJ e à Fundação Universitária José Bonifácio, em razão do Edital BNDES - Chamada Pública para seleção de propostas no âmbito da iniciativa Resgatando a História No. 01/2021, agosto de 2021.
MELLO, H. Trabalhando com dados de fala: a experiência do Projeto C-Oral-Brasil. In: BRESCANCINI, C. R. Projeto VARSUL: Variação Linguística no Sul do País 36 anos. Porto Alegre: Zouk Editora. p. 41-69.
OEZ, M. A guide to the documentation of the Beth Qustan dialect of the Central Neo-Aramaic Language Turoyo. Language Documentation and Conservation, v. 12, p. 339-358, 2018. Disponível em: https://scholarspace.manoa.hawaii.edu/handle/10125/24773. Acesso em: 15 set 2020.
PRESEEA: Corpus del Proyecto para el estudio sociolingüístico del español de España y de América. (2014) Alcalá de Henares: Universidad de Alcalá. Disponível em: http://preseea.linguas.net. Acesso em: 15 set. 2020.
RADEMAKER, A. et al. Universal Dependencies for Portuguese. In: Proceedings of the Fourth International Conference on Dependency (Depling). 2017. Pisa. Proceedings […]. Pisa, 2017. p. 197-206.
SANTOS, D.; ROCHA, P. Evaluating CETEMPúblico, a free resource for Portuguese. In: Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics. 2001. Toulouse. Proceedings […]. Toulouse, 2001. p. 442-449.
SETTE, G. et al. Português: trilhas e tramas. Vol 2. 2 ed. São Paulo: Leya, 2016.
SILVA, F.C.C.; SILVEIRA, L. O ecossistema da Ciência Aberta. Transinformação, v.31, e190001, 2019. http://dx.doi.org/10.1590/2318-889201931e190001. Disponível em: https://www.scielo.br/pdf/tinf/v31/2318-0889-tinf-31-e190001.pdf. Acesso em: 03 jul. 2020.
SILVA, G. M. O. Coleta de dados. In: MOLLICA, M. C.; BRAGA, M. L. (Orgs). Introdução à Sociolinguística. São Paulo: Contexto, 2004. p. 117-134.
SILVA, R. G.; COELHO, I. M. W. S. Metodologia de criação de um banco de dados linguísticos: desafios e contribuições para o processo de ensino-aprendizagem. Educitec-Revista de Estudos e Pesquisas sobre Ensino Tecnológico, v. 6, p. 1-15, 2020. Disponível em: http://200.129.168.14:9000/educitec/index.php/educitec/article/view/905. 10 out. 2021.
TAGLIAMONTE, S. A. Variationist sociolinguistics: Change, observation, interpretation. Malden: Wiley-Blackwell, 2012.
TAGLIAMONTE, S. A. Data, data and more data. In: TAGLIAMONTE, S. A. Analysing sociolinguistic variation. Cambridge: Cambridge University Press; 2006. p.50-69.
VANN, R. E. Best Practices for Information Architecture, Organization, and Retrieval in Digital Language Archives within University Institutional Repositories. In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021. p. 36-39. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.
WEINREICH, U.; LABOV, W.; HERZOG, M. Empirical Foundations for a Theory of Language Change. In: LEHMANN, W. P.; MALKIEL, Y. (EDS.) Directions for Historical Linguistics: A Symposium. Austin: The University of Texas Printing Division, 1968. p. 95-188. Disponível em: https://liberalarts.utexas.edu/lrc/resources/books/directions/index.php. Acesso em: 02 jan 2021.
WILKINSON, M., et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data, v.3, n. 160018, 2016. DOI https://doi.org/10.1038/sdata.2016.18. Disponível em: https://www.nature.com/articles/sdata201618. Aceso em: 30 jun. 2020.
ZEE, V. D. T; REICH, J. Open Education Science. AERA Open, v. 4, n.3, p. 1-15, 2018. DOI: 10.1177/2332858418787466.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
2) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado.