Learn You a Japanese

万事入门难,尤其是语言的学习,日语对于初学者而言也实在算不上友好,是个刚进门就要你去熟悉几乎 100 个 符号$letter : Symbol$ 的语言,可不是开玩笑的。另一方面,日语作为一门黏着语,尽管规则繁琐,但学习难度会随着你不断深入而降低。

序言

注意!本系列文章所进行讨论的日语专指现代标准日语,其它日语均不在讨论范畴中。

学习日语了也有一段时间了,本着「如果你不能把一个问题跟六岁小孩解释清楚,那你并不真的理解它」的原则, 想要分享一些学习心得作为阶段性的总结。

UPDATE!!! 2019-01-01

这几天看了一些关于日语难度的讨论,普遍认为非常难,我用自己的话总结一下,主要观点有以下:

  1. 固定句式太多。
  2. 汉字读音不规则,比如一个「生」字就有 104 种读音。
  3. 说话时的语气、态度、礼节等,有时为了配合语气,句式搭配也要发生变化,并且只能从助词和活用下手。

确实日语比我想象中还要复杂,我也发表下我的观点:

  1. 我认为固定规则的众寡并不能断言一门语言本身的难度,至少在这个信息大爆炸的时代, 无时无刻都有人在创造新的词汇和句型。看远的有科研,日常生活中国内还有大秦话、抽象话等网络流行语。 这些词汇句型或者说「梗」也都是固定的,这难道就说汉语也在变得越来越难学?
  2. 汉字读音不规则确实给日语增加了不少复杂度,虽然少数情况下(学术论文、文献、书籍) 这个问题被振假名解决了,且日常生活中说话时可以直接判断读音,但在大多数情况下也只能死记硬背了。
  3. 作为整个语言中复杂度最高的一部分,无可厚非确实非常难,但句型搭配变化,助词与活用终归是有限的。 只要你一直学就只会觉得越来越简单,而不是越来越难。

回归主题,本系列文章旨在教你一点日语,想教给大家的只有隐藏在语言下的抽象, 而不是每一条具体规则都事无巨细地进行剖析和解释。因为事实上,你并不需要知道 「『生』的 104 种读法」又或者「用语气较轻的敬语去表达欲拒还迎心理的 n 种方法」 才能使用日语进行交流。要做到那种程度的不是学习,是研究,或者可以说,那是孔乙己。




日语书写系统

日语书写系统是指使用文字来记载或写作等的系统方法。现代日语书写系统由三种文字构成:

  • 漢字かんじ($\mathrm{Ka\bar{n}ji}$)

    日语的汉字多用在文字的语干上,并且常常与平假名搭配进行使用,这是标准的和最常用的书写日语的方式。

    对处于汉字文化圈中心的我们来说,利用自身已有的汉字知识去学习日语能够为我们减轻不少记忆的负担。

  • 平仮名ひらがな($\mathrm{Hiragana}$)

    平假名是一种音节文字,常常与汉字搭配用在动词结尾、介词等位置。

    抛开发音部分不谈,我觉得平假名更像是拉丁字母或者汉字的笔画一样的存在,属于文字系统中的原子部分。

    我刚开始学假名时有一个坏习惯,在看到一个假名时总要先回想一下它的罗马音,这应该是不熟练的体现吧。 我为什么会说这是个坏习惯,因为如果假名和拉丁字母是位于同格的存在, 那么我们在看到一个假名时在脑海中浮现出来的应该是这个符号所代表的声音或者是一张嘴的形状才对。 这就像我们看到汉字时直接就联想到它的发音,而不是拼音。

    我想表达的是,比如「『あ』」这个符号,它的发音就是「あ」,而不是「A」, 同理「『しょ』」这串符号的发音就是「しょ」而不是「SHO」或者「SYO」。

    使用罗马音去注释假名,这种用一套发音系统去解释另一套发音系统的方法,就像早期的 Lisp 编译器, 仅仅只是把 Lisp 编译成 C,再调用 C 语言的编译器编译成汇编,是效率低下且存在误差的。

  • 片仮名カタカナ($\mathrm{Katakana}$):

    片假名是另一种音节文字,主要用于训读、作状声词、标明外来词汇和将外国人姓名转换成日语音节。 按照我以前的想法,这应该是一种由某任天皇发明出来,用来欺骗百姓和外国人的假名(骗假名), 因为它除了刚才说到的几点用处以外,几乎再没什么其它用处了。

    由于转标后的假名读起来和原词相比简直驴唇不对马嘴,并且这种转标又被进行强制推广和广泛使用, 导致了日本人学习外语发音时的重重困难,形成了诸如「日式英语」的笑话,可谓「既不表音,又不表意」。 据说由于现代日本人对于片假名的滥用,加上大量拉丁母语者不屑于学习汉字,汉字的识字率一直在降低。

  • ロウマ字($\mathrm{R\bar{o}maji}$)

    罗马字是一种使用拉丁字母为假名发音进行转写标注的拼音方式。 转写规则有不少变种,本系列文章均采用一种叫作传统平文式的转写规则。




自然语言与计算机语言

Chromsky 倾向于将语言看作是一个有限或无限的句子集,句子的长度都是有限的,并且都是由有限的音素构成。 所有语言或书面形式的自然语言都是这种意义上的语言,因为每种自然语言都有有限数量的音素, 尽管有无限多的句子,但每个句子都可以表现为这些音素的有限序列(序列意味着出现次序是重要的)。 类似地,句子的集合在一些形式化的数学系统中可以也被认为是一种语言。

而对于计算机而言,当我们尝试使用某种编程语言去表达某种想法的时候, 我们应该特别注意语言本身提供的将简单的想法组合形成更复杂的想法的手段

而任何强大的语言都应该具有三种机制去达成这项目的:

  • 基本元素:代表与语言所关注的最简单的实体。
  • 组合的方式:将基本元素构建成复合元素的方式。
  • 抽象的手段:将复合元素进行命名和操纵的手段。

虽然自然语言与计算机语言有所区别,但我认为这三种机制对于自然语言同样是说的通的。

基本元素对应了自然语言的「音素Phoneme」、「语素Morpheme」。

对日语来说最基本的元素当属五个元音素「あ、い、う、え、お」了, 这五个元音作为五个段又与其它辅音共同构成了现在的「五十音」、「浊音」、「拗音」等。 关键在于,这些由母音演变过来的子音,完全可以都当作基本元素来使用,享受与元音相同的待遇。

这一个或多个音素组合成了复合音素,而复合音素又能抽象成具体的概念,并赋予实际意义, 最终才成为了一个最小的语素。

举个实际的例子,比如说 わたし($\mathrm{Watashi}$) 这个词组, 它由三个音素「わ、た、し」按次序组合成「わたし」后,再规定它作为用于表述自身的代词。 而为了避免这个「わたし」和代表了其它概念但也写或读作「わたし」的语素相混淆, 又将这个「わたし」写成了「私」,你可以说这等同于汉语中的「『我』」

事实上,如果要打破砂锅问到底「私」究竟是什么的话,答案是「私」不是「我」, 它只是一个符号,只是这个符号被用来代表柏拉图概念下的「我」。

但更重要的是我现在可以自由自在地使用「私」,让「私」与其它词素组合, 把它当作一个基本元素用在更复杂的组合中,一个句子就是这么组成的。

当然一个合乎文法的句子还是需要按照既定的语法规则进行组合, 一个不合文法组合出来的句子只会使人感到困惑而已。

词法的结构

对于一门自然语言的学习而言,在学完了那些最基本的音素以后,你接下来还要学习这门语言的词法与句法。 关于词法Lexeme,简单来说就是关于词组的限定原则,包括词的构成和变化的规则。 词法的结构即这些表面规则所表达的结构,也就是形态学Morphology

注意!本系列文章所进行讨论的日语专指现代标准日语,其它日语均不在讨论范畴中。




十大品词

在讲词法之前先简单介绍一下日语的词组词性,即词的语法分类。在日语中,存在十种词类,所谓「十大品词」。

十大品词之间的关系我斥巨资(时间)打造了一张思维导图如下:

pos

这种思维导图做起来也不难,就是 Tex+TikZ,最后用 Inkscape 编译成 svg。

为什么我没有做成传统教学材料里的简单树形结构,而是这种有环网状拓扑结构? 确实树形图和表格形式对于词的性质和分类能够看起来很直观,但树形图无法表达品词与品词之间的关系和联系。

如果你不拘小节的话,可以代换一下图中模型的概念, 自立语和付属语就是实词和虚词,活用与非活用即意味着词缀是否会产生变化。

十大品词中有四种是有必要用上活用的,变换的规则虽不晦涩,但也实在过于繁琐,可以说是写满了的模式匹配。 出于这种原因,一些没有学业压力作为动力、纯粹出于兴趣或一时兴起的初学者很容易在这个阶段就放弃。

体言 $\stackrel{\bold{def}}{\equiv}$ 名词

体言是泛指一切物体以及指代物体名字的词组,由于体言只涵盖了名词,所以将体言定义为名词可以方便很多。

而代词和数词又是名词的子集,从这一点上进行分析,似乎日本人眼中,数量的概念也是存在着实体的。

体言属于非活用的词类之一,这同时意味着其它的品词与体言组合成复合词组时,体言总是不需要变化。

由于日语有专用的助词来决定词组在句子中的地位(成分),只要使用不同的格助词即可断言词组在句子中的格, 所以体言无需对格产生变化也是情理之中。 举个英语中的反例,当『我』作为主格时用「I」,而作宾格时要用「Me」。

用言 $\xrightarrow[]{\text{活用}}$ 自立语

用言是指那些能够活用以适应句子结构的自立语词组,这些词组多数情况下都充当了句子里的谓语角色。 关于形容动词不用过于纠结它的名字,其实它只是应用了另一套活用规则的形容词而已。 动词、形容词、形容动词等用言在活用变换后逻辑上仍是自立语。

说个轶事,英语起初将形容动词翻译为 Na-adjectiveな形容词, 之后发现形容动词与名词的诸多相似性,又改成了 Adjectival noun形容词性名词

这三种品词在句子中的作用、地位、成分,甚至允许出现的位置都十分地类似,这种相似性的好处是什么? 这意味着我们几乎能够完全平等地去对待和使用它们,只是处理它们具体的手段(活用)不同而已。

再举个英语中的反例,比如短语「the major question」中的「major」一词就不能直接用在谓语位置, 换句话说「The question major」是不符合文法的。为了使句子合乎文法,需要在「major」前加上系动词「is」 形成主系表结构「The question is major」,不过此时「major」也已经成为表语而不再是谓语了。

事实上我们很难从「谓语」和「表语」这两个词的字面上得知它们之间的任何联系, 而对于「Predicate」和「Predicative」,却给了我们一种直觉,它们之间的关系是显而易见不言而喻的。

活用在进行变化时,词组的语尾(送假名),乃至整个词组都可能发生变化。 变化后的词组可以通过与其它词组进行组合来表示时态、词类、语态等文法上的功能。

活用变化有六种(不是我分的),变换后对应了六种形态:未然形、连用形、终止形、连体形、假定形、命令形。

现今所说的『推量形』并非是一种独立的形态,而是未然形的一种形式。

为了维持文章的连贯性以避免阅读时会产生不必要的分散性、碎片性,这里只写词性, 关于用言的其它细节部分我决定写在文章的后半部分

连体词、接续词、副词、感动词

首先连体词的性质与两类形容词十分相似,它们的功能都是用作修饰体言的性质和状态。 由于连体词无法应用于活用的变换,这一定程度限制了它的表达力,导致了它注定无法被当作谓词来使用。 我猜一开始为品词取名那些人也发现了这个问题,但他们同样发现了这类词与形容词连体形的高度相似, 并且都是连着体言去修饰体言的性质和状态,干脆就取名连体词了。

其它词先摸了。。。

!TODO

付属语 $:$ 组合子

附属语也摸了。。。

!TODO

词$_1$ $\circ$ 词$_2$ $\stackrel{?}{=}$ 词$_3$

上一章就音素而言稍微谈了一点关于组合的方式,实际上这种组合的方式是可以轻松拓展到词法逻辑上的。

为了方便操作,不妨把体言的活用当作一种 $x \rightarrow x$ 的自态射(自圈),即它的活用就是他自己。

那么词法的组合可以简单地形式化如下:

\[\frac{\Gamma \vdash x : \sigma \qquad \Gamma \vdash u : \sigma}{\Gamma \vdash x \circ u : \tau}, \qquad \sigma \in \{ \text{n, adj, verb, adj-verb} \}\]

其中 $\tau$ 为十大品词中的任意自立语。




活用的变换

连体形

对于连体形,我们可以构造 lambda 抽象:

\[\frac{\Gamma \vdash x : \sigma \qquad \Gamma, x : \sigma \vdash t : \sigma \rightarrow \tau } {\Gamma \vdash \lambda x : \sigma . t(x) : \tau}\]

其中 $\sigma$ 是用言的类型,$\tau$ 是连体词的类型,即一个用言经过变换可成为连体词。

未然形

!TODO

终止形

!TODO

假定形

!TODO

命令形

!TODO

连用形

无内鬼,来点连用形笑话:

  • よくない。
  • なくよくない。
  • なくなくよくない。
  • なくなくなくよくない。
  • 。。。。。。

!TODO




词法闭包

词法中的类型论

宾语补足语和双宾语是三个参数的动词的两种重载。

!TODO

「He makes me happy」不能说成「He makes me happiness」,后者属于参数类型传错了。

!TODO

句法的结构

对于任意自然语言,不存在一种句法是无可代替的、只有它才能表达出某种意思,如果有,这个东西该算作词汇。 但我们却可以这么说,总是有一种句法,它在某个场景中的表达力更优,使用时更为优雅。

私 が  林檎 を苹果  食べる

这句话我故意使用了「が」替换了日常生活中使用地最频繁的「は」。

从语法的结构上分析,很多人都可以轻松地指出该句子的「主宾谓」结构,但到底是什么断言了该句子的结构? 是格助词吗?是语法顺序吗?还是两者都有?

先说格助词,比起分析语和曲折语,黏着语的语法普遍都使用着格助词这一类词去划分句子的成分。 那么问题就来了,如果一个句子的结构仅由格助词断言,那为何很少有人使用「宾主谓」的结构呢, 理论上在所有表达中「主宾谓」或「宾主谓」都应该各占一半才对,事实上并没有。 再者,假设只要使用格助词,主宾的位置就可以随意交换,这种情况下讨论一个句子是不是「主宾谓」 其实意义不大,因为这个句子理论上可以变成任意结构。

举个例子,上面那句话换成「宾主谓」的结构会是这样的:

林檎 を苹果  私 が  食べる

原则上这个句子是符合文法的,尽管它可能看起来或读起来会很怪,但却不能说它是文法错误的。

这是黏着语特有的功能,如果是曲折语,比如英语,你不能将「I eat apple」换成「Apple eat i」, 因为你的主格「I」不能放到谓词后面。你更不能换成「Apple eat me」,这样一来主宾格交换意思就变了。 分析语同理,只不过分析语比起曲折语更加重视语法顺序,比如汉语,就不类推了。

既然如此,为什么语法顺序也同样重要呢?说实话,我也不懂,等我懂了以后再说吧。

音韵

先码个 Title。。。等我精通以后再讲

发音体系

つづく