Bancos de dados sociolinguísticos e a Ciência Aberta

compartilhamento de dados e conhecimentos

Authors

  • Marta Deysiane Alves Faria Sousa professoramarta2018@outlook.com
    Universidade Federal de Sergipe
  • Raquel Meister Ko. Freitag rkofreitag@uol.com.br
    Universidade Federal de Sergipe https://orcid.org/0000-0002-4972-4320

Keywords:

Ciência Aberta; , Bancos de dados sociolinguísticos;

Abstract

 Sociolinguistic databases have been a referential source for the description of the different varieties of Brazilian Portuguese and have been affording other social functions. However, the knowledge produced by Variationist Sociolinguistics has not been recognized in Brazilian scenario, as Labov (2020) argued about the contributions of Sociolinguistics in the United States. This fact can be observed through the mechanist examples of semantic variation in the teaching of Portuguese language, as well as the visibility received by “internet linguists” that disseminate linguistic prejudice. Therefore, in this text, we present a reflection about the adoption of a few principles of Open Science may contribute to the strengthening of the area in Brazilian society.

Author Biography

Raquel Meister Ko. Freitag, Universidade Federal de Sergipe

Professora do Departamento de Letras Vernáculas, do Programa de Pós-Graduação em Letras e do Programa de Pós-Graduação em Psicologia da Universidade Federal de Sergipe. Graduada em Letras, mestre e doutora em Linguística pela Universidade Federal de Santa Catarina. Atualmente, estuda o processamento da variação linguística, observando pistas corporificadas de esforço, atenção e emoções. Atua em estudos de reprodutibilidade em linguística e em psicologia experimental, em iniciativas de grandes grupos, e está participando da constituição da Rede Brasileira de Reprodutibilidade na Ciência. É Pesquisadora Associada da Rede Nacional de Ciência para Educação (CpE) e editora-chefe da Revista da ABRALIN. Desenvolve atividades de popularização da ciência e estímulo à pesquisa na educação básica, com o projeto Cienart e com a organização da Feira Científica de Sergipe durante a Semana Nacional de Ciência e Tecnologia e a publicação da revista Feira de Ciência & Cultura, específica para a publicação de relatos de pesquisa desenvolvida pela educação básica. Coordena o Laboratório Multiusuário de Informática e Documentação Linguística (LAMID) da Universidade Federal de Sergipe. Sua atuação político-administrativa envolve gestão de entidades de classe e de instâncias governamentais. Foi vice-presidente da Associação Brasileira de Linguística ABRALIN (2019-2021), gestão que implantou a série Abralin ao Vivo e o evento online Linguistweets. Foi vice-presidente da associação do Grupo de Estudos Linguísticos e Literários do Nordeste (GELNE), por duas gestões, (2019-2020 e 2021-2022). Foi secretária da Associação Sergipana de Ciência ASCi (2016-2018). Atualmente, é coordenadora da área de Letras/Linguística do Comitê de Assessoramento do CNPq (2021-2024) e coordenadora do Programa de Pós-Graduação em Letras da Universidade Federal de Sergipe. Por uma sociolinguística socialmente sensível, alinhada ao movimento Ciência Aberta: https://rkofreitag.github.io.

References

ARAÚJO, A. A. o projeto norma oral do português popular de fortaleza NORPOFOR. In: XV CONGRESSO NACIONAL DE LINGUÍSTICA E FILOLOGIA, v. 15, n. 5, 2011, Rio de Janeiro. Anais [...] Rio de Janeiro: CiFEFiL, 2011. p. 835-845. Disponível em: https://url.gratis/h5Lgdm. Acesso em: 23 ago. 2019.

ARAUJO, S. S. F.; ALMEIDA, N. L. F. O Projeto A língua portuguesa no semiárido baiano – Fase 3: critérios de constituição e da amostragem do banco de dados. In: FREITAG, R. M. KO. (Org.). Metodologia de Coleta e Manipulação de Dados em Sociolinguística. São Paulo: Blücher, 2014. p. 27-48. Disponível em: https://url.gratis/fUwn0w. Acesso em: 05 ago. 2020.

ALUÍSIO, S., PELIZZONI, J., MARCHI, A.R., DE OLIVEIRA, L., MANENTI, R., MARQUIAFÁVEL, V. 2003. An Account of the Challenge of Tagging a Reference Corpus for Brazilian Portuguese. In: Proceedings of the 6th International Conference on Computational Processing of the Portuguese Language (PROPOR). Proceedings […] PROPOR, 2003.

BAILEY, G.; TILLERY, J. Some Sources of Divergent Data in Sociolinguistics. In: FOUGHT, C. (Ed.) Sociolinguistic Variation: Critical Reflections. Nova Iorque: Oxford University Press, 2004. p. 11-30.

BICK. E. The Parsing System “Palavras”. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Tese (Doutorado) - Departamento de Linguística, Universidade de Aarhus, 2000.

BRASIL. Ministério da Educação. Edital de convocação Nº 01/2021 – CGPLI. [EDITAL DE CONVOCAÇÃO PARA O PROCESSO DE INSCRIÇÃO E AVALIAÇÃO DE OBRAS DIDÁTICAS, LITERÁRIAS E PEDAGÓGICAS PARA O PROGRAMA NACIONAL DO LIVRO E DO MATERIAL DIDÁTICO - PNLD 2023. Diário Oficial da União, seção 3, Brasília, DF, n. 30, p. 47, 12 fev 2021.

BRASIL. Base Nacional Comum Curricular. Brasília: MEC, 2017.

BRASIL. Parâmetros Curriculares Nacionais: Terceiro e quarto ciclos do ensino fundamental. Língua Portuguesa. Brasília: MEC, 1998.

BURKE, M.; CHELLIAH, S. L. Challenges to Representing Personal Names and Language Names in Language Archives: Examples from Northeast India. In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021. p. 44-46. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.

CALAMAI, S. FRONTINI, F. FAIR data principles and their application to speech and oral archives. Journal of New Music Research, v. 47, n. 4, 339–354, 2018. Disponível em: https://www.tandfonline.com/doi/full/10.1080/09298215.2018.1473449?scroll=top&needAccess=true. Acesso em: 30 jun. 2020.

CARVALHO, A. M. Corpus del Español en el Sur de Arizona (CESA). University of Arizona. 2012. Disponível em: cesa.arizona.edu. Acesso em: 12 set. 2020.

CASTILHO, A. T. Gramática do português brasileiro: fundamentos, perspectivas. Cadernos de Linguística, v. 2, n. 1, p. 01-17, 2021. Disponível em: https://cadernos.abralin.org/index.php/cadernos/article/view/252. Acesso em 08 out. 2021.

CESARINO, L. Pós-verdade e a crise do sistema de peritos: uma explicação cibernética. Ilha Revista de Antropologia, v. 23, n. 1, p. 73-96, 2021. Disponível em: https://periodicos.ufsc.br/index.php/ilha/article/view/75630. Acesso em: 16 mar. 2023.

COLLISCHONN, G.; MONARETTO, V. O. Banco de dados V ARSUL: a relevância de suas características e a abrangência de seus resultados. ALFA: Revista de Linguística, v.56, n.3, p. 835-853, 2012. Disponível em: https://periodicos.fclar.unesp.br/alfa/article/view/4953. Acesso em: 20 abr. 2019.

FIDLER, F.; WILCOX, J. Reproducibility of Scientific Results. In: ZALTA, E. N. (Ed.) The Stanford Encyclopedia of Philosophy. Disponível em: https://plato.stanford.edu/archives/win2018/entries/scientific-reproducibility/. Acesso em: 08 jul. 2019.

FREITAG, R. M. K., Linguistic Repositories as Asset: Challenges for Sociolinguistic Approach in Brazil. In: In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021b. p. 33-35. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.

FREITAG, R. M. K. Amostras sociolinguísticas: probabilísticas ou por conveniência? Revista de Estudos da Linguagem, v. 26, n. 2, p. 667-686, 2018. Disponível em: http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/12412/0. Acesso em: 10 set. 2021.

FREITAG, R. M. K. Documentação sociolinguística: coleta de dados e ética em pesquisa. São Cristóvão: Editora UFS, 2017a Disponível em: https://www.livraria.ufs.br/produto/documentacao-sociolinguistica-coleta-de-dados-e-etica-em-pesquisa/. Acesso em: 10 jun. 2020.

FREITAG, R. M.K. A dadidade (ou dadidão) do dado, Linguística Rio, v.3, n.1, p.1-10, 2017b

FREITAG, R. M. K. Sociolinguística no/do Brasil. Cadernos de Estudos Linguísticos, v. 58, n. 3, p. 445-460, 2016.

FREITAG, R. M. K.; MARTINS, M. A.; TAVARES, M. A. FREITAG, R. M. K.; MARTINS, M. A.; TAVARES, M. A. Banco de dados sociolinguísticos do português brasileiro e os estudos de terceira onda: Potencialidades e limites. ALFA: Revista de Linguística, v.56, n.3, p. 917-944, 2012. Disponível em: https://www.scielo.br/pdf/alfa/v56n3/a09v56n3. Acesso em: 16 set. 2020.

FREITAG, R. M. K.; ROST SNICHELOTTO, C. A. Análises contrastivas: estabilidade, variedade ou metodologia?. Working Papers em Linguística, v. 16, n. 1, p. 157-167, 2015. Disponível em: https://periodicos.ufsc.br/index.php/workingpapers/article/view/1984-8420.2015v16n1p157. Acesso em 01 dez 2021.

FREITAG, R. M. K.; SANTANA, C. C.; ANDRADE, T. R. C. Práticas constitutivas do povoado Açuzinho. Revista Ambivalências, v. 2, n. 3, p.194-217, 2014. Disponível em: https://seer.ufs.br/index.php/Ambivalencias/article/view/3129. Acesso 12 set. 2021.

GALVES, C.; ANDRADE, A. L.; FARIA, P. Tycho Brahe Parsed Corpus of Historical Portuguese. 2017.

GARELLEK, M. et al. Toward open data policies in phonetics: What we can gain and how we can avoid pitfalls. Journal of Speech Science, v. 9, n. 1, p.3-16, 2020. Disponível em: https://halshs.archives-ouvertes.fr/halshs-02894375/. Acesso em: 01 jun. 2021.

GONÇALVES, S. C. L. Projeto ALIP (Amostra Linguística do Interior Paulista) e banco de dados Iboruna: 10 anos de contribuição com a descrição do português brasileiro. Estudos Linguísticos, v. 48, n. 1, p. 276-29, abr. 2019. Disponível em: https://revistas.gel.org.br/estudos-linguisticos/article/view/2430/1503. Aceso em: 25 abr. 2019.

GILMORE, R.; KENNEDY, J. L.; ADOLPH, K. E. Practical solutions for sharing data and materials from psychological research. Adv Methods Pract Psychol Sci, v. 1, n. 1, p. 121-130, 2018. Disponível em: https://journals.sagepub.com/doi/full/10.1177/2515245917746500. Acesso em: 01 jun. 2021.

JUSTICE as a linguistic matter. Conferência apresentada por William Labov. [s.l., s.n], 2020. 1 vídeo (1h 06min 33s). Publicado pelo canal da Associação Brasileira de Linguística. Disponível em: https://www.youtube.com/watch?v=cr5tyw8_gT0&t=2231s. Acesso em: 23 mai. 2020.

KENDALL, T. Data in the Study of Variation and Change. CHAMBERS, J. K.; SCHILLING, N. (Eds.). The handbook of language variation and change. 2ª Ed. Malden: Wiley-Blackwell, 2013. p. 38-56.

KENDALL, T. On the History and Future of Sociolinguistic Data. Language and Linguistics Compass, v. 2, n. 2, p. 332-351, 2008. Disponível em: https://onlinelibrary.wiley.com/doi/10.1111/j.1749-818X.2008.00051.xAcesso em 20 mai. 2019.

KENDALL, T.; FRENCH, A. Digital Audio Archives, Computer-Enhanced Transcripts, and New Methods in Sociolinguistic Analysis. Digital Humanities, Paris, Jul., p. 110-112, 2006. Disponível em: https://slaap.chass.ncsu.edu/pdfs/DH2006_pp110-112.pdf. Acesso em: 20 mai. 2019.

LABOV, W. Padrões sociolinguísticos. Trad. Marcos Bagno, Maria Marta Pereira Scherre, Caroline Rodrigues Cardoso. São Paulo: Parábola Editorial, 2008. [1972]

LABOV, W. The social stratification of English in New York city. Cambridge University Press, 2006. [1966]

LABOV, W. Principles of linguistic change: Social factors. Malden: Blackwell, 2001. v.2

LABOV, W. Contraction, deletion, and inherent variability of the English copula. Language, v. 45, n. 4, p. 715-762, 1969. Disponível em: https://www.jstor.org/stable/412333. Acesso em: 13 jul. 2021.

LABOV, W. Field methods of the project on linguistic change and variation. Sociolinguistic working paper, n.81, p. 1- 43, 1981. Disponível em: https://eric.ed.gov/?id=ED250938. Acesso em: 13 jul. 2021.

MACHADO VIEIRA, M. S. et. al. Plataforma da Diversidade Linguística Brasileira. Projeto apresentado à Pró-Reitoria de Pós-Graduação e Pesquisa da UFRJ e à Fundação Universitária José Bonifácio, em razão do Edital BNDES - Chamada Pública para seleção de propostas no âmbito da iniciativa Resgatando a História No. 01/2021, agosto de 2021.

MELLO, H. Trabalhando com dados de fala: a experiência do Projeto C-Oral-Brasil. In: BRESCANCINI, C. R. Projeto VARSUL: Variação Linguística no Sul do País 36 anos. Porto Alegre: Zouk Editora. p. 41-69.

OEZ, M. A guide to the documentation of the Beth Qustan dialect of the Central Neo-Aramaic Language Turoyo. Language Documentation and Conservation, v. 12, p. 339-358, 2018. Disponível em: https://scholarspace.manoa.hawaii.edu/handle/10125/24773. Acesso em: 15 set 2020.

PRESEEA: Corpus del Proyecto para el estudio sociolingüístico del español de España y de América. (2014) Alcalá de Henares: Universidad de Alcalá. Disponível em: http://preseea.linguas.net. Acesso em: 15 set. 2020.

RADEMAKER, A. et al. Universal Dependencies for Portuguese. In: Proceedings of the Fourth International Conference on Dependency (Depling). 2017. Pisa. Proceedings […]. Pisa, 2017. p. 197-206.

SANTOS, D.; ROCHA, P. Evaluating CETEMPúblico, a free resource for Portuguese. In: Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics. 2001. Toulouse. Proceedings […]. Toulouse, 2001. p. 442-449.

SETTE, G. et al. Português: trilhas e tramas. Vol 2. 2 ed. São Paulo: Leya, 2016.

SILVA, F.C.C.; SILVEIRA, L. O ecossistema da Ciência Aberta. Transinformação, v.31, e190001, 2019. http://dx.doi.org/10.1590/2318-889201931e190001. Disponível em: https://www.scielo.br/pdf/tinf/v31/2318-0889-tinf-31-e190001.pdf. Acesso em: 03 jul. 2020.

SILVA, G. M. O. Coleta de dados. In: MOLLICA, M. C.; BRAGA, M. L. (Orgs). Introdução à Sociolinguística. São Paulo: Contexto, 2004. p. 117-134.

SILVA, R. G.; COELHO, I. M. W. S. Metodologia de criação de um banco de dados linguísticos: desafios e contribuições para o processo de ensino-aprendizagem. Educitec-Revista de Estudos e Pesquisas sobre Ensino Tecnológico, v. 6, p. 1-15, 2020. Disponível em: http://200.129.168.14:9000/educitec/index.php/educitec/article/view/905. 10 out. 2021.

TAGLIAMONTE, S. A. Variationist sociolinguistics: Change, observation, interpretation. Malden: Wiley-Blackwell, 2012.

TAGLIAMONTE, S. A. Data, data and more data. In: TAGLIAMONTE, S. A. Analysing sociolinguistic variation. Cambridge: Cambridge University Press; 2006. p.50-69.

VANN, R. E. Best Practices for Information Architecture, Organization, and Retrieval in Digital Language Archives within University Institutional Repositories. In: ZAVALINA, O. L.; CHELLIAH, S. L. (Eds.) International Workshop on Digital Language Archives, LanArc2021, 2021, Barcelona. Proceedings […] [s. l.] University of Texas, 2021. p. 36-39. Disponível em: http://hdl.handle.net/2142/111675. Acesso em: 04 out. 2021.

WEINREICH, U.; LABOV, W.; HERZOG, M. Empirical Foundations for a Theory of Language Change. In: LEHMANN, W. P.; MALKIEL, Y. (EDS.) Directions for Historical Linguistics: A Symposium. Austin: The University of Texas Printing Division, 1968. p. 95-188. Disponível em: https://liberalarts.utexas.edu/lrc/resources/books/directions/index.php. Acesso em: 02 jan 2021.

WILKINSON, M., et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data, v.3, n. 160018, 2016. DOI https://doi.org/10.1038/sdata.2016.18. Disponível em: https://www.nature.com/articles/sdata201618. Aceso em: 30 jun. 2020.

ZEE, V. D. T; REICH, J. Open Education Science. AERA Open, v. 4, n.3, p. 1-15, 2018. DOI: 10.1177/2332858418787466.

Published

2024-05-07

How to Cite

Alves Faria Sousa, M. D., & Meister Ko. Freitag, R. (2024). Bancos de dados sociolinguísticos e a Ciência Aberta: compartilhamento de dados e conhecimentos. Revista Diálogos, 12(1), 165–187. Retrieved from https://periodicoscientificos.ufmt.br/ojs/index.php/revdia/article/view/16105

Issue

Section

Caderno Estudos Linguísticos e Literários