The deadline for submission of abstracts for the workshop on the status and use of corpora in linguistics at Montpellier University (1st & 2nd June 2012) has been extended to the 1st of March.
Apologies for cross-listings.
Call for Papers: On the status and use of corpora in linguistics
Workshop, June 1-2, 2012, Equipe EMMA
(Etudes Montpelliéraines du Monde Anglophone), Université Montpellier III
In recent years, an increasing amount of research in linguistics has been corpus-based. This is true in a variety of sub-fields within linguistics: in sociolinguistics (Docherty & Foulkes 2000), in syntax (e.g. Sampson 1996, 2001), and in phonology (Durand & Eychenne 2004), and second language acquisition (e.g. Gregg 2003), for instance. The aim of this workshop is to consider the status and use of corpora in linguistic investigation. The issues we wish to discuss are meta-theoretical, theoretical and descriptive/methodological (often all three simultaneously). Among those issues are the following:
Is the object of linguistic enquiry constituted as collections of observed utterances? Should corpus data supplement intuitive well-formedness judgements (Durand 2009), or be privileged over them, or even replace them, as suggested by Sampson (2005) for syntax and Pierrehumbert et al. (2000) for phonology? Or is Itkonen (1978) right to assert that grammatical inquiry crucially relies on intuitive well-formedness judgements, since those judgements tap into social conventions, rather than observable events (thus Itkonen’s claim that corpus-based work in grammatical enquiry is ‘idle ceremony’; see Riemer 2009a, 2009b and Lopez-Serena 2009 for discussion).
Does the use of corpora guarantee empirical and/or scientific status for the investigation in question? What exactly do 'empirical' and 'scientific' mean? If corpus-based investigation is empirical, does such investigation support some version of Empiricism in linguistics?
Does corpus-based work support one kind of theoretical approach over another? For example, Arndt-Lappe (2011) claims that corpus-based investigation of English noun-noun compounds supports exemplar theory (Bybee 2001, Pierrehumbert et al. 2001), rather than generative approaches, such as those of Giegerich (2004) and Liberman & Sproat (1992). What light, if any, does corpus-based investigation shed on the role of token frequency, as appealed to in exemplar-based approaches to linguistic investigation?
In what senses may different corpora (e.g. the Brown corpus, the LOB corpus, the British National Corpus) be said to be representative? Representative of what, exactly?
To what extent can corpora be used by researchers who have not constituted the corpus?
Do corpora allow us access to theory-free, 'objective' data that constitute some kind of 'reality'? Or is Scheer (2004) right to assert that 'Il n'existe pas de corpus sans théorie'? ('There are no theory-free corpora'). Is Scheer (2004) justified in asserting that 'Le corpus ne représente pas la réalité: il représente la réalité de celui qui l'a construite' ('A corpus does not represent 'reality' in the singular: it represents the reality of the person who constructed it')?
We welcome papers from corpus linguists who wish to present and discuss the methodological problems they have encountered in establishing their corpora, and who wish to link those problems with the general issues outlined above.
We intend to focus on the analysis of English and French, but the analysis of other languages is not excluded. Papers may be given in English or French.
Interested researchers are invited to send a 400-word abstract (excluding references) in French or in English to corporainlinguistics@gmail.com before February 20th 2012.
Plenary speaker: Tobias Scheer (Université de Nice)
Organizing committee: Philip Carr, Caroline David, Sandra Deshors, Isabelle Ronzetti, Laurence Vincent-Durroux (EMMA - Université Montpellier 3)
Scientific committee: Philip Carr, Laurence Vincent-Durroux (EMMA - Université Montpellier 3), Jacques Durand (Université de Toulouse Le Mirail)
Important dates:
- abstract submission deadline: February 20th 2012
revised deadline for abstracts: 1st March 2012
- notification of acceptance: March 26th 2012
- registration deadline: April 30th 2012 (registration fee: 30 euros; 15 euros for students)
Website: https://sites.google.com/site/corporainlinguistics/home
Appel à communications : Statut et utilisation des corpus en linguistique
Journées d’étude, 1-2 juin 2012, Équipe EMMA
(Études Montpelliéraines du Monde Anglophone), Université Montpellier III
La recherche en linguistique s'appuie de plus en plus sur des corpus, et ce, dans des domaines variés de la linguistique, par exemple la sociolinguistique (Docherty & Foulkes, 2000), la syntaxe (Sampson, 1996, 2001), la phonologie (Durand & Eychenne, 2004) ou encore l'apprentissage des langues étrangères (Gregg, 2003). Le but de cette journée d'étude est d'examiner le statut et l'utilisation des corpus dans l'analyse linguistique. Les questions que nous souhaitons traiter sont d'ordre métathéorique, théorique ou descriptif / méthodologique. Elles relèvent parfois de plusieurs ordres et peuvent être formulées ainsi :
L'objet de l'analyse linguistique est-il constitué d'énoncés regroupés ? Les données des corpus devraient-elles venir en complément des jugements intuitifs d'acceptabilité (Durand, 2009) ou bien avoir préséance sur eux, voire les remplacer ainsi que le suggèrent Sampson (2005) pour la syntaxe et Pierrehumbert et al. (2000) pour la phonologie ? Ou bien Itkonen (1978) a-t-il raison de poser que l'analyse grammaticale repose fondamentalement sur des jugements intuitifs d'acceptabilité, puisque, selon lui, ces jugements sont accessibles grâce à une connaissance des conventions sociales plutôt que grâce aux phénomènes observables (raison pour laquelle Itkonen affirme que le travail sur corpus pour l'analyse grammaticale ne sert à rien ; voir discussion dans Riemer, 2009a, 2009b et Lopez-Serena, 2009).
L'utilisation de corpus est-elle une garantie du statut empirique et / ou scientifique de l'analyse menée ? Que signifient exactement les termes "empirique" et "scientifique" ? Si l'analyse menée sur corpus est empirique, une telle analyse conforte-t-elle une certaine version de l'empirisme en linguistique ?
Le travail sur corpus conduit-il à favoriser une approche théorique plutôt qu'une autre ? Par exemple, Arndt-Lappe (2011) affirme que l'analyse des composés nominaux en anglais dans des corpus plaide en faveur de la théorie des instances (« exemplar theory »: voir Bybee, 2001, Pierrehumbert et al. 2001) plutôt que des approches génératives (Giegerich, 2004 et Liberman & Sproat, 1992). L'analyse sur corpus peut-elle éclairer, et si oui de quelle manière, le rôle joué par la fréquence des occurrences, rôle auquel font appel les approches linguistiques fondées sur la théorie des instances ?
Dans quel sens différents corpus (tels que le Brown corpus, le LOB corpus, le British National Corpus) peuvent-ils être considérés comme représentatifs ? Et représentatifs de quoi, précisément ?
Dans quelle mesure des corpus peuvent-ils être utilisés par des chercheurs qui ne les ont pas constitués ?
Les corpus nous donnent-ils accès à des données "objectives", non liées à une théorie et renvoyant à une forme de réalité ? Ou bien Scheer (2004) a-t-il raison d'affirmer qu'"il n'existe pas de corpus sans théorie" et que "le corpus ne représente pas la réalité: il représente la réalité de celui qui l'a construit" ?
Nous sollicitons des propositions de communication de linguistes qui souhaitent présenter et discuter les problèmes méthodologiques posés par la constitution de leurs corpus et qui souhaitent faire le lien entre ces problèmes et les questions générales esquissées ci-dessus. L'analyse du français et de l'anglais sera privilégiée mais l'analyse d'autres langues n'est pas exclue.
Les communications pourront se faire en anglais ou en français.
Pour proposer une communication, merci d'adresser un résumé de 400 mots (hors références) en français ou en anglais à corporainlinguistics@gmail.com avant le 20 février 2012.
Conférencier invité : Tobias Scheer (Université de Nice)
Comité d'organisation : Philip Carr, Caroline David, Sandra Deshors, Isabelle Ronzetti, Laurence Vincent-Durroux (EMMA - Université Montpellier 3)
Comité scientifique : Philip Carr, Laurence Vincent-Durroux (EMMA - Université Montpellier 3), Jacques Durand (Université de Toulouse Le Mirail)
Dates à retenir :
- date-limite pour soumettre un résumé : 20 février 2012
extension de la date-limite pour soumettre un résumé: 1er mars 2012
- notification d'acceptation : 26 mars 2012
- date-limite pour l'inscription : 30 avril 2012 (frais d'inscription : 30 euros ; étudiants : 15 euros)
Site internet : https://sites.google.com/site/corporainlinguistics/home
References / références
Arndt-Lappe, S. (2011). ‘Towards an exemplar-based model of stress in English noun-noun compounds’. Journal of Linguistics 47.3: 549-585.
Bybee, J. (2001). Phonology and language use. Cambridge: Cambridge University Press.
Docherty, G. & P. Foulkes (2000). ‘Speaker, speech and knowledge of sounds’ In Burton-Roberts, N., P. Carr & G. Docherty (eds.) Phonological knowledge: conceptual and empirical issues. Oxford: Oxford University Press. 105-130.
Durand, J. (2009). ‘On the scope of linguistics: data, intuitions, corpora’. In: Corpus and Variation in Linguistic Description and Language Education, Y. Kawaguchi, M. Minegishi et J. Durand (eds),Amsterdam/Philadelphia, John Benjamins. pp. 25-52.
Durand, J. & J. Eychenne (2004). ‘Le schwa en français: pourquoi des corpus?’ In Scheer, T. (ed.) Usage des corpus en phonologie. Corpus 3 : 311-356.
Giegerich, H. (2004). ‘Compound or phrase? English noun-plus-noun constructions and the stress criterion.’ English Language and Linguistics 8.1: 1-24.
Gregg, K.R. (2003). ‘SLA theory: construction and assessment.’ In Doughty & Long (eds.) The Handbook of Second Language Assessment. Oxford: Blackwell. 831-865.
Itkonen, E. (1978). Grammatical theory and metascience. Amsterdam : Benjamins.
Liberman, M. & R. Sproat (1992). ‘The stress and structure of modified noun phrases in English.’ In Sag, I. & Szabolcsi (eds.) Lexical matters. Stanford: CSLI publications. 131-181.
Lopez-Serena, A. (2009). ‘Intuition, acceptability and grammaticality: a reply to Riemer.’ Language Sciences 31.5: 634-648.
Pierrehumbert, J. (2001). ‘Exemplar dynamics: word frequency, lenition, and contrast.’ In Bybee, J & P; Hopper (eds.) Frequency effects and the emergence of lexical structure. Amsterdam: Benjaims. 137-157.
Pierrehumbert, J., M.E. Beckman & D.R. Ladd (2000). ‘Conceptual foundations of phonology as laboratory science. In Burton-Roberts, N., P. Carr & G. Docherty (eds.) Phonological knowledge: conceptual and empirical issues. Oxford: Oxford University Press. 273-304
Riemer, N. (20079). ‘Grammaticality as evidence and as prediction in a Galilean linguistics’. Language Sciences 31.5: 612-633.
Riemer, N. (2009b). ‘On not having read Itkonen: empiricism and intuitions in the generative data debate.’ Language Sciences 31.5: 649-662.
Sampson, G. (1996). ‘From central embedding to corpus linguistics’. In Thomas, J. & M. Short (eds.) Using corpora for language research. London: Longman. Reprinted in Sampson 2001.
Sampson, G. (2001). Empirical linguistics. London: Continuum.
Sampson, G. (2005). The ‘language instinct’ debate. London: Continuum.
Scheer, T. (2004). ‘Le corpus heuristique: un outil qui montre mais ne démontre pas’. In Scheer, T. (ed.) Usage des corpus en phonologie. Corpus 3: 153-192.