前言:本文主要参考的书籍是由南京大学的胡安教授与章维益教授主编的《固体物理学》(【高等教育出版社】第三版),我决定分成两部分内容更新,第一部分是教材上第一章至第四章的内容,也就是晶体的结构与对称性、晶体的结合、晶体动力学和晶体的热学性质、能带论,第二部分则是第五章至第八章的内容,即金属电子论、半导体电子论、固体磁性、超导电性.更新计划是将一个大部分一起更新.当然本来是打算分开一章章更新的,不过想了想还是决定做到第四章后一起部署上来.另外,这篇博客可能不算严格意义上的笔记,更多是节选书上的部分进行摘抄并在某些地方加入个人的理解.
第一章 晶体的结构及对称性
1. 晶格及其平移对称性
简单立方晶体结构: 将同一种元素的原子置于立方体的顶角上,便得到简单立方晶体结构,这是一种自然界非常罕见的结构,因为这种结构往往并不对应能量最低的基态.其配位数为6.堆积密度为 π / 6 \pi / 6 π / 6
体心立方结构:将一个相同的原子置于简单立方结构的立方体的中心,便得到体心立方晶体结构.相当多的金属,如碱金属 L i Li L i 、 N a Na N a 、 K K K 、 R b Rb R b 、 C s Cs C s 和难熔金属 W W W 、 M o Mo M o 、 N b Nb N b 、 T a Ta T a 等,具有体心立方晶体结构。其配位数为8.堆积密度为 3 π / 8 \sqrt{3} \pi /8 3 π / 8
密堆晶体结构:如果按照ABCABC···序列堆积,便构成面心立方(fcc)晶体结构,很多金属,例如 C u Cu C u 、 A g Ag A g 、 A u Au A u 、 A l Al A l 、 N i Ni N i 等晶体具有面心立方晶体结构.如果按照ABABAB…序列堆积,便构成六角密堆(hcp)晶体结构,许多元素的原子,例如 B e Be B e 、 M g Mg M g 、 Z n Zn Z n 、 C d Cd C d 、 T i Ti T i 等,构成的晶体具有六角密堆晶体结构.其配位数均为12,堆积密度均为 2 π / 6 \sqrt{2} \pi /6 2 π / 6
金刚石结构:碳原子除了占据立方体的顶角和面心外,还在四条空间对角线上有4个碳原子,其中两个处于两条空间对角线的1/4处,另两个处于剩下两条空间对角线的3/4处.除了金刚石外,重要的半导体晶体如硅和锗也具备金刚石结构.其配位数为4,堆积密度为 3 π / 16 \sqrt{3} \pi /16 3 π / 1 6
N a C l NaCl N a C l 结构:将 N a + Na^{+} N a + 离子和 C l − Cl^{-} C l − 离子交替排列在一个简单立方晶格上,构成 N a C l NaCl N a C l 结构.每个离子有六个异类离子作为最近邻,配位数为6.除了 N a C l NaCl N a C l 外,如 L i F LiF L i F 、 K C l KCl K C l 、 L i I LiI L i I 等都具有 N a C l NaCl N a C l 晶体结构.
C s C l CsCl C s C l 结构:与体心立方结构相似,只是体心为一种离子,顶角为另一种离子.每一个离子位于异类离子构成的立方体中心,配位数为8.如 T l B r TlBr T l B r 、 T l I TlI T l I 、 N H 4 C l NH_4 Cl N H 4 C l 等都具有 C s C l CsCl C s C l 结构.
闪锌矿结构:在金刚石结构中,如果在面心立方位置放一种离子,而空间对角线位置放另一种离子,就可以得到闪锌矿结构.每种离子位于异类离子构成的正四面体中心,配位数为4.具有闪锌矿结构的有 Z n S ZnS Z n S 、 C u F CuF C u F 、 C u C l CuCl C u C l 、 A g I AgI A g I 、 Z n S e ZnSe Z n S e 等.
钙钛矿 ( A B O 3 ABO_3 A B O 3 )结构: A A A 原子位于立方体的顶角, B B B 原子位于体心位置,氧原子位于面心位置.即 B B B 原子位于氧原子形成的八面体中心.钙钛矿结构氧化物的种类庞大且性能丰富.如典型的铁电晶体 B a T i O 3 BaTiO_3 B a T i O 3 、 l i N b O 3 liNbO_3 l i N b O 3 、 P b Z r O 3 PbZrO_3 P b Z r O 3 ,高温超导体的稀土铜氧化物,具有特大磁电阻的稀土锰氧化物,都具有钙钛矿结构或畸变的钙钛矿结构.
从以上讨论可以看出存在两种不同的晶体结构,一种是从一个原子到另一个原子的平移后晶格完全复原,称为简单晶格或布拉维各自.若不能复原,即存在两种或两种以上不等价的原子时,称为复式晶格.但一个复式晶格总可以看作两个或两个以上的布拉维各自套构而成.但是无论是简单晶格还是复式晶格都能找到一个最小的完全等价的结构单元.一个理想的晶体可以由这个全同的结构单元在空间无限周期重复得到.这个基本的结构基元称为基元.而点阵则是结构的数学抽象,则将基元按点阵排布,就能得到晶体结构.即 < 点 阵 > + < 基 元 > = < 晶 体 结 构 > <点阵> + <基元> = <晶体结构> < 点 阵 > + < 基 元 > = < 晶 体 结 构 > .
为了在数学上描述一个点阵,总可以选择三个不同的平移矢量 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 (称为点阵的基矢),使得矢量
R l = l 1 a 1 + l 2 a 2 + l 3 a 3 = ∑ i = 1 3 l i a i \boldsymbol{R_l}=l_1 \boldsymbol{a_1} + l_2 \boldsymbol{a_2} + l_3 \boldsymbol{a_3} = \sum_{i=1}^{3}l_i \boldsymbol{a_i}
R l = l 1 a 1 + l 2 a 2 + l 3 a 3 = i = 1 ∑ 3 l i a i
当 l i l_i l i 取一切正负整数包括0时,矢量 R l \boldsymbol{R_l} R l 端点的集合包含且仅包含点阵中的所有结点.若将其用一个空间的密度函数表示为 ρ ( r ) = ∑ l δ ( r − R l ) \rho (r)=\sum_{l}\delta (\boldsymbol{r}-\boldsymbol{R_l}) ρ ( r ) = ∑ l δ ( r − R l ) ,即一系列峰值在 R l \boldsymbol{R_l} R l 的 δ \delta δ 函数之和,则 ρ ( r ) \rho (r) ρ ( r ) 应该是 R l \boldsymbol{R_l} R l 的周期函数 ρ ( r + R l ) \rho (\boldsymbol{r}+\boldsymbol{R_l}) ρ ( r + R l ) ,可见晶格并不对任意的平移不变,而只对一组离散的平移矢量 R l \boldsymbol{R_l} R l ( l l l 只取整数)具有不变性,称为破缺的平移对称性.
对于一个给定的点阵,基矢的选择不是唯一的,存在无限多种不等价的选取方式.但每种选择必须满足 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 所构成的平行六面体体积 a 1 ⋅ ( a 2 × a 3 ) \boldsymbol{a_1} \cdot (\boldsymbol{a_2} \times \boldsymbol{a_3}) a 1 ⋅ ( a 2 × a 3 ) 相等,其中只包含一个结点.
对于一个点阵,通常定义三种元胞:初基元胞,单胞和维格纳-塞茨(Wigner-Seitz)元胞,简称W-S元胞.其中初基元胞是一个最小空间体积元,当通过所有平移适量 R l \boldsymbol{R_l} R l 作平移时,它可以既无交叠,也不留下空隙地填满整个空间.因此初基元胞只包含一个结点.其在空间中所占体积为
Ω = a 1 ⋅ ( a 2 × a 3 ) \Omega = \boldsymbol{a_1} \cdot (\boldsymbol{a_2} \times \boldsymbol{a_3})
Ω = a 1 ⋅ ( a 2 × a 3 )
对于简单立方点阵,通常选择
a 1 = a i , a 2 = a j , a 3 = a k \boldsymbol{a_1}=a\boldsymbol{i},\qquad \boldsymbol{a_2}=a\boldsymbol{j},\qquad \boldsymbol{a_3}=a\boldsymbol{k}
a 1 = a i , a 2 = a j , a 3 = a k
其中 a a a 为立方胞的边长, i , j , k \boldsymbol{i},\boldsymbol{j},\boldsymbol{k} i , j , k 为直角坐标系中的单位矢量,可将 a 1 , a 2 , a 3 \boldsymbol{a_1},\boldsymbol{a_2},\boldsymbol{a_3} a 1 , a 2 , a 3 在直角坐标系的分量写成矩阵形式:
( a 1 a 2 a 3 ) = a ( 1 0 0 0 1 0 0 0 1 ) ( i j k ) = A ( i j k ) A = a ( 1 0 0 0 1 0 0 0 1 ) \begin{pmatrix} \boldsymbol{a}_1 \\ \\ \boldsymbol{a}_2 \\ \\ \boldsymbol{a}_3 \end{pmatrix}=a \begin{pmatrix} 1 & 0 & 0 \\ \\ 0 & 1 & 0 \\ \\ 0 & 0 & 1 \end{pmatrix} \begin{pmatrix} \boldsymbol{i} \\ \\ \boldsymbol{j} \\ \\ \boldsymbol{k} \end{pmatrix}=\boldsymbol{A} \begin{pmatrix} \boldsymbol{i} \\ \\ \boldsymbol{j} \\ \\ \boldsymbol{k} \end{pmatrix}\quad\boldsymbol{A}=a \begin{pmatrix} 1 & 0 & 0 \\ \\ 0 & 1 & 0 \\ \\ 0 & 0 & 1 \end{pmatrix}
⎝ ⎜ ⎜ ⎜ ⎜ ⎛ a 1 a 2 a 3 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = a ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 1 0 0 0 1 0 0 0 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ i j k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ = A ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ i j k ⎠ ⎟ ⎟ ⎟ ⎟ ⎞ A = a ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 1 0 0 0 1 0 0 0 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
初基元胞的体积为:
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = a 3 \Omega =\boldsymbol{a_1} \cdot (\boldsymbol{a_2} \times \boldsymbol{a_3}) = |\boldsymbol{A}| =a^3
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = a 3
其中 ∣ A ∣ |\boldsymbol{A}| ∣ A ∣ 为矩阵 A \boldsymbol{A} A 的行列式值.
对于体心立方点阵,通常选择三个对称的基矢
a 1 = a 2 ( − i + j + k ) a 2 = a 2 ( + i − j + k ) a 3 = a 2 ( + i + j − k ) \begin{gathered} \boldsymbol{a_{1} }=\frac{a}{2}(-\boldsymbol{i}+\boldsymbol{j}+\boldsymbol{k}) \\ \boldsymbol{a_{2} }=\frac{a}{2}(+\boldsymbol{i}-\boldsymbol{j}+\boldsymbol{k}) \\ \boldsymbol{a_{3} }=\frac{a}{2}(+\boldsymbol{i}+\boldsymbol{j}-\boldsymbol{k}) \end{gathered}
a 1 = 2 a ( − i + j + k ) a 2 = 2 a ( + i − j + k ) a 3 = 2 a ( + i + j − k )
矩阵形式为
A = a 2 ( − 1 + 1 + 1 + 1 − 1 + 1 + 1 + 1 − 1 ) \boldsymbol{A}=\frac{a}{2} \begin{pmatrix} - & 1 & + & 1 & + & 1 \\ \\ + & 1 & - & 1 & + & 1 \\ \\ + & 1 & + & 1 & - & 1 \end{pmatrix}
A = 2 a ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ − + + 1 1 1 + − + 1 1 1 + + − 1 1 1 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
初基元胞的体积为:
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = 1 2 a 3 \Omega =\boldsymbol{a_1} \cdot (\boldsymbol{a_2} \times \boldsymbol{a_3}) = |\boldsymbol{A}| =\frac{1}{2}a^3
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = 2 1 a 3
对于面心立方点阵,也通常选择三个对称的基矢
a 1 = a 2 ( j + k ) a 2 = a 2 ( k + i ) a 3 = a 2 ( i + j ) \begin{gathered} \boldsymbol{a_{1} }=\frac{a}{2}(\boldsymbol{j}+\boldsymbol{k}) \\ \boldsymbol{a_{2} }=\frac{a}{2}(\boldsymbol{k}+\boldsymbol{i}) \\ \boldsymbol{a_{3} }=\frac{a}{2}(\boldsymbol{i}+\boldsymbol{j}) \end{gathered}
a 1 = 2 a ( j + k ) a 2 = 2 a ( k + i ) a 3 = 2 a ( i + j )
矩阵形式为
A = a 2 ( 0 1 1 1 0 1 1 1 0 ) \boldsymbol{A}=\frac{a}{2} \begin{pmatrix} 0 & 1 & 1 \\ \\ 1 & 0 & 1 \\ \\ 1 & 1 & 0 \end{pmatrix}
A = 2 a ⎝ ⎜ ⎜ ⎜ ⎜ ⎛ 0 1 1 1 0 1 1 1 0 ⎠ ⎟ ⎟ ⎟ ⎟ ⎞
初基元胞的体积为:
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = 1 4 a 3 \Omega =\boldsymbol{a_1} \cdot (\boldsymbol{a_2} \times \boldsymbol{a_3}) = |\boldsymbol{A}| =\frac{1}{4}a^3
Ω = a 1 ⋅ ( a 2 × a 3 ) = ∣ A ∣ = 4 1 a 3
基矢 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 往往不构成正交系,也往往不能直观地反映点阵的宏观对称性,但是它们都能完全反映点阵的平移对称性.
而单胞则可以直观地反映点阵的宏观对称性,其基矢 a \boldsymbol{a} a , b \boldsymbol{b} b , c \boldsymbol{c} c 要尽可能地构成正交系.单胞是一个扩大了地元胞,其不能通过所有的平移矢量 R l = l 1 a 1 + l 2 a 2 + l 3 a 3 \boldsymbol{R_l}=l_1 \boldsymbol{a_1} + l_2 \boldsymbol{a_2} + l_3 \boldsymbol{a_3} R l = l 1 a 1 + l 2 a 2 + l 3 a 3 无交叠地填满整个空间,只能通过点阵平移矢量地一个子集 T m = m 1 a + m 2 b + m 3 c \boldsymbol{T_m}=m_1 \boldsymbol{a} + m_2 \boldsymbol{b} + m_3 \boldsymbol{c} T m = m 1 a + m 2 b + m 3 c 作平移来无交叠地填满整个空间,不能完全反映点阵的平移对称性.但因其能充分反映点阵的宏观对称性,因此在结晶学中常常采用单胞.
点阵的W-S元胞是一种既能完全反映点阵平移对称性,又能充分反映点阵宏观对称性的点阵结构单元.点阵的结点处于元胞的中心而不在元胞的顶角上.通过所有平移矢量 R l = l 1 a 1 + l 2 a 2 + l 3 a 3 \boldsymbol{R_l}=l_1 \boldsymbol{a_1} + l_2 \boldsymbol{a_2} + l_3 \boldsymbol{a_3} R l = l 1 a 1 + l 2 a 2 + l 3 a 3 作平移,可以无交叠地填充整个空间,因此一个W-S元胞中只包含一个结点,它是初基的.构造一个结点W-S元胞的方法是:把这个结点同所有其它结点(往往只是近邻结点)用直线连接起来,作这些连线的中垂面.这些面包围的最小多面体,构成这个结点的W-S元胞.下图展示了一些例子.
由于W-S元胞是初基的,既能完全反映点阵的平移对称性,又能完全反映点阵的宏观对称性,因此在固体物理学的理论研究中有着重要应用.
2. 晶列和晶面
点阵的结点可以看成分布在一系列相互平行的直线上,这些直线称为一族晶列.一族晶列应将点阵中所有结点包含无遗.每一族晶列定义了一个方向,称晶向.如果从一个结点沿某晶列方向到最近邻结点的平移矢量为
R l = l 1 a 1 + l 2 a 2 + l 3 a 3 \boldsymbol{R_l}=l_1 \boldsymbol{a_1} + l_2 \boldsymbol{a_2} + l_3 \boldsymbol{a_3}
R l = l 1 a 1 + l 2 a 2 + l 3 a 3
则用 l 1 l_1 l 1 , l 2 l_2 l 2 , l 3 l_3 l 3 来标志该晶列所对应的晶向,记为 [ l 1 l 2 L 3 ] [l_1 l_2 L_3] [ l 1 l 2 L 3 ] ,称为晶向指数.由于晶格的对称性,常用 < l 1 l 2 L 3 > <l_1 l_2 L_3> < l 1 l 2 L 3 > 来表示点阵中一组对称的晶向.
点阵的结点也可以看成分布在一系列平行且等间距的平面上,这些晶面称为一族晶面.一族晶面的任何一个晶面上应有无穷多结点,而一族晶面应将所有结点包括无遗.在书本上有着一系列的推导,在这里就不推导了,直接将结论给出.首先是用方向余弦和截距去标志晶面是等价的,然后是晶面有理指数定律,即晶体中任一晶面在基矢天然坐标系中的截距为有理数,并且截距的倒数必为互质的整数.由此便可由晶面在基矢坐标轴上的截距的倒数化为互质的整数后的 h 1 h_1 h 1 , h 2 h_2 h 2 , h 3 h_3 h 3 来标志晶面,用圆括号记为 h 1 h 2 h 3 h_1 h_2 h_3 h 1 h 2 h 3 ,一组方位不用的对称晶面用花括号表示为 { h 1 h 2 h 3 } \left\{h_1 h_2 h_3 \right\} { h 1 h 2 h 3 } .
晶面的标志取决于所采用的坐标系,以基矢 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 为坐标系决定的指数称为晶面指数,记为 ( h 1 h 2 h 3 ) (h_1 h_2 h_3) ( h 1 h 2 h 3 ) .以单胞的三条棱 a \boldsymbol{a} a , b \boldsymbol{b} b , c \boldsymbol{c} c 为坐标系决定的指数称为米勒指数,记为 ( h k l ) (hkl) ( h k l ) .可注意到由于单胞的基矢 a \boldsymbol{a} a , b \boldsymbol{b} b , c \boldsymbol{c} c 所构成的平移矢量只是点阵平移矢量的子集,它所平移得到的结点也会遗漏部分结点,同理也会遗漏部分晶面.
3. 倒点阵
在物理学中一个问题可以在坐标空间描述,也可以在动量空间(波矢空间)描述,如量子力学中的坐标表象与动量表象.且波矢空间是坐标空间的傅里叶变换,因此波矢空间又称为坐标空间的傅里叶空间.而在固体物理学中,通常称坐标空间为正空间,称波矢空间为到空间.通常可用正点阵的三个基矢 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 定义倒空间的三个基矢:
{ b 1 = 2 π a 2 × a 3 a 1 ⋅ ( a 2 × a 3 ) b 2 = 2 π a 3 × a 1 a 1 ⋅ ( a 2 × a 3 ) b 3 = 2 π a 1 × a 2 a 1 ⋅ ( a 2 × a 3 ) \left\{\begin{matrix}\boldsymbol{b_1} = 2\pi \frac{\boldsymbol{a}_2 \times \boldsymbol{a}_3}{\boldsymbol{a}_1 \cdot (\boldsymbol{a}_2 \times \boldsymbol{a}_3)} \\\boldsymbol{b_2 }= 2\pi \frac{\boldsymbol{a}_3 \times \boldsymbol{a}_1}{\boldsymbol{a}_1 \cdot (\boldsymbol{a}_2 \times \boldsymbol{a}_3)} \\\boldsymbol{b_3} = 2\pi \frac{\boldsymbol{a}_1 \times \boldsymbol{a}_2}{\boldsymbol{a}_1 \cdot (\boldsymbol{a}_2 \times \boldsymbol{a}_3)} \end{matrix}\right.
⎩ ⎪ ⎨ ⎪ ⎧ b 1 = 2 π a 1 ⋅ ( a 2 × a 3 ) a 2 × a 3 b 2 = 2 π a 1 ⋅ ( a 2 × a 3 ) a 3 × a 1 b 3 = 2 π a 1 ⋅ ( a 2 × a 3 ) a 1 × a 2
且满足
a i ⋅ b j = 2 π δ i j = { 2 π , 当 i = j 时 0 , 当 i ≠ j 时 ( i , j = 1 , 2 , 3 ) \boldsymbol{a_i}\cdot \boldsymbol{b_j}=2\pi\delta_{ij}= \begin{cases} 2\pi, & \text{当}i=j\text{时} \\ 0, & \text{当}i\neq j\text{时} & \end{cases}\quad(i,j=1,2,3)
a i ⋅ b j = 2 π δ i j = { 2 π , 0 , 当 i = j 时 当 i = j 时 ( i , j = 1 , 2 , 3 )
至于利用密度函数,傅里叶变换,泊松求和公式,正格矢与动量空间任意矢量来推导倒格矢的过程就不写了,想看的可以看书.倒格矢可写为
K h = h 1 b 1 + h 2 b 2 + h 3 b 3 \boldsymbol{K_h}=h_1 \boldsymbol{b_1}+ h_2 \boldsymbol{b_2}+ h_3 \boldsymbol{b_3}
K h = h 1 b 1 + h 2 b 2 + h 3 b 3
在波矢空间中的 K h \boldsymbol{K_h} K h 决定了一个无穷分立结点的集合,称为由 R l \boldsymbol{R_l} R l 决定的正点阵的倒点阵, b 1 \boldsymbol{b_1} b 1 , b 2 \boldsymbol{b_2} b 2 , b 3 \boldsymbol{b_3} b 3 称为倒点阵的基矢. b 1 \boldsymbol{b_1} b 1 , b 2 \boldsymbol{b_2} b 2 , b 3 \boldsymbol{b_3} b 3 在倒空间所围成的平行六面体称为倒点阵的初基元胞,它在倒空间所占体积为
Ω ∗ = b 1 ⋅ ( b 2 × b 3 ) \Omega ^{*}= \boldsymbol{b_1} \cdot (\boldsymbol{b_2}\times \boldsymbol{b_3})
Ω ∗ = b 1 ⋅ ( b 2 × b 3 )
每个初基元胞中只包含一个倒格点.即每个晶体结构有两个点阵同它联系着,一个是正点阵,一个是倒点阵.由一组倒格矢 K h \boldsymbol{K_h} K h 所确定的那些结点有着特别的重要性,这点会在后面的散射等多地方看到.
倒点阵的一些性质,至于推导过程同理这里也不将给出.
一. 正,倒点阵的基矢相互正交 a i ⋅ b j = 2 π δ i j \boldsymbol{a_i}\cdot \boldsymbol{b_j}=2\pi\delta_{ij} a i ⋅ b j = 2 π δ i j
二. 倒点阵元胞的体积反比于正点阵元胞体积 Ω ∗ = ( 2 π ) 3 Ω \Omega ^{*}=\frac{(2\pi)^3}{\Omega} Ω ∗ = Ω ( 2 π ) 3 .
三. 正点阵是它本身倒点阵的倒点阵
四. 通常很少采用倒点阵基矢 b 1 \boldsymbol{b_1} b 1 , b 2 \boldsymbol{b_2} b 2 , b 3 \boldsymbol{b_3} b 3 围成的平行六面体作为倒点阵的初基元胞,而总是采用倒点阵的W-S初基元胞,因为它充分反映了倒点阵宏观对称性.倒点阵的W-S元胞呗称为第一布里渊区(Brillouin zone).
五. 倒点阵保留了正点阵的全部宏观对称性,二者有相同的点群对称性.
六. 正点阵的一族晶面 ( h 1 h 2 h 3 ) (h_1 h_2 h_3) ( h 1 h 2 h 3 ) 垂直于倒格矢 K h = h 1 b 1 + h 2 b 2 + h 3 b 3 \boldsymbol{K_h}=h_1 \boldsymbol{b_1}+ h_2 \boldsymbol{b_2}+ h_3 \boldsymbol{b_3} K h = h 1 b 1 + h 2 b 2 + h 3 b 3 ,且晶面间距 d h 1 h 2 h 3 = 2 π K h d_{h_1 h_2 h_3} = \frac{2\pi}{\boldsymbol{K_h} } d h 1 h 2 h 3 = K h 2 π .
七. 正点阵的周期函数 V ( r ) = V ( r + R l ) \boldsymbol{V(\boldsymbol{r})}=\boldsymbol{V(\boldsymbol{r}+\boldsymbol{R_l})} V ( r ) = V ( r + R l ) 可以按倒格矢 K h \boldsymbol{K_h} K h 展开为傅里叶级数 V ( r ) = ∑ h V ( K h ) e i K h ⋅ r \boldsymbol{V(\boldsymbol{r})}= \sum_{h}\boldsymbol{V(\boldsymbol{K_h})}e^{i\boldsymbol{K_h} \cdot \boldsymbol{r} } V ( r ) = ∑ h V ( K h ) e i K h ⋅ r , V ( K h ) = 1 Ω ∫ Ω V ( r ) e − i K h ⋅ r d r \boldsymbol{V(\boldsymbol{K_h})} = \frac{1}{\Omega}\int _{\Omega}\boldsymbol{V(\boldsymbol{r})}e^{-i\boldsymbol{K_h} \cdot \boldsymbol{r} }d \boldsymbol{r} V ( K h ) = Ω 1 ∫ Ω V ( r ) e − i K h ⋅ r d r (在后面能带论的PW法会用到)
4. 晶体的宏观对称性
当晶体绕晶轴旋转时能够复原时,这种对称性则称为晶体的宏观对称性.因为在绕某轴旋转或对某点反演时,晶体中至少有一点不动,即晶体未作平移,所以这类对称性又称点对称性.从数学上来看,点对称操作实质上是对晶体作一定的集合变换,它是晶体中某一点 r ( x 1 , x 2 , x 3 ) → r ′ ( x 1 ′ , x 2 ′ , x 3 ′ ) = A r ( x 1 , x 2 , x 3 ) \boldsymbol{r(x_1 ,x_2 ,x_3)} \to \boldsymbol{r^{'}(x_1^{'} ,x_2^{'} ,x_3^{'})}=\boldsymbol{A}\boldsymbol{r(x_1 ,x_2 ,x_3)} r ( x 1 , x 2 , x 3 ) → r ′ ( x 1 ′ , x 2 ′ , x 3 ′ ) = A r ( x 1 , x 2 , x 3 ) ,其中 A \boldsymbol{A} A 为变换矩阵.总的来说,有以下结论
(1)这种几何变换是正交变换 A T A = I \boldsymbol{A^{T} }\boldsymbol{A}=\boldsymbol{I} A T A = I .
(2)如果一个晶体在某正交变化下不变,就称这个变换是晶体的一个对称操作.
(3)要描述一个晶体的对称性就是要列举它所具有的全部对称操作,一个晶体所具有的对称操作越多,表明它的对称性越高.
(4)三维晶体的正交变换总可以表示为绕某一轴的转动,对某中心的反演和它们的组合,基本的变换的矩阵可表示为旋转(设转轴为 x x x ,旋转角为 θ \theta θ ),中心反演(r → − r \boldsymbol{r} \to \boldsymbol{-r} r → − r )
A = ( 1 0 0 0 cos θ − sin θ 0 sin θ cos θ ) , ∣ A ∣ = 1 \boldsymbol{A}= \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos\theta & -\sin\theta \\ 0 & \sin\theta & \cos\theta \end{pmatrix},\quad\mid \boldsymbol{A}\mid=1
A = ⎝ ⎛ 1 0 0 0 cos θ sin θ 0 − sin θ cos θ ⎠ ⎞ , ∣ A ∣ = 1
A = ( − 1 0 0 0 − 1 0 0 0 − 1 ) , ∣ A ∣ = − 1 \boldsymbol{A}= \begin{pmatrix} -1 & 0 & 0 \\ 0 & -1 & 0 \\ 0 & 0 & -1 \end{pmatrix},\quad\mid \boldsymbol{A}\mid=-1
A = ⎝ ⎛ − 1 0 0 0 − 1 0 0 0 − 1 ⎠ ⎞ , ∣ A ∣ = − 1
利用对称操作可以概括一个物体的对称性,但是为了简便起见,可以不一一列举一个物体的所有对称操作,而是描述它所具有的对称素.所谓对称素就是一个物体借以进行对称操作的一根轴、一个平面或一个点.
(1)如果一个物体绕某轴旋转 2 π n \frac{2\pi}{n} n 2 π 及其倍数不变,称该轴为 n n n 次旋转轴,记为 n n n .
(2)如果一个物体对某点反演不变,称这个点为对称心.记为 i i i .
(3)如果一个物体绕某轴旋转 2 π n \frac{2\pi}{n} n 2 π 后再反演不变,称该轴为 n n n 次旋转反演轴,或者象转轴,记为 n ‾ \overline{n} n .
第一类操作称纯旋转操作.第二,第三类称非纯旋转操作.
由于对于晶体,其受到原子规则排列的严格限制,它只能具有有限个数的宏观对称操作或对称素,对称素的组合也是一定的,称为宏观对称性的破缺.首先是由晶体的周期性可简单的推导得晶体只可能具有 1 1 1 , 2 2 2 , 3 3 3 , 4 4 4 , 6 6 6 次旋转轴,不能具有5次或6次以上的旋转轴,同理也只能有 1 ‾ \overline{1} 1 , 2 ‾ \overline{2} 2 , 3 ‾ \overline{3} 3 , 4 ‾ \overline{4} 4 , 6 ‾ \overline{6} 6 旋转反演轴.且有
(1) 1 ‾ \overline{1} 1 就是对称心 i i i ,即 1 ‾ = i \overline{1} = i 1 = i .
(2) 2 ‾ \overline{2} 2 就是垂直于该轴的对称镜面,记为 m m m ,即 2 ‾ = m \overline{2}=m 2 = m .
(3) 3 ‾ \overline{3} 3 等价于一个3次轴加上对称心,即 3 ‾ = 3 + i \overline{3}=3+i 3 = 3 + i .
(4) 6 ‾ \overline{6} 6 等价于3次轴加上垂直于该轴的对称面,即 6 ‾ = 3 + m \overline{6}=3+m 6 = 3 + m .
(5) 4 ‾ \overline{4} 4 是一种特殊的对称素,具有 4 ‾ \overline{4} 4 的晶体既没有4次轴也没有对称心 i i i ,但包含一个与它重合的2次轴.
综上所述,晶体的宏观对称性只具有8种独立的对称素
1 , 2 , 3 , 4 , 6 , 1 ‾ ( i ) , 2 ‾ ( m ) , 4 ‾ 1,2,3,4,6,\overline{1}(i),\overline{2}(m),\overline{4}
1 , 2 , 3 , 4 , 6 , 1 ( i ) , 2 ( m ) , 4
其中1次旋转轴等价于不动操作E.并且由于平移对称性对晶体宏观对称性的限制,晶体可能具有的对称素的组合也受到严格的限制.不仅如此,晶体的宏观物理性质也与宏观对称性有着密切关系,如具有立方对称的晶体的介电常量二阶张量会退化为一个标量,具有正四面体对称的晶体的介电常量张量也会退化为一个标量,具有六角对称的晶体介电常量会在不同方向有着不同的表现导致晶体双折射现象等.这里就不作推导也不进行赘述了.
5. 晶体点阵和结构的分类
既然要按对称性将晶体进行分类,那就要涉及到晶体学中的点群和空间群理论.所以先介绍一下群的定义:在数学上,定义一组元素(有限或无限)的集合, G ≡ E , g 1 , g 2 , . . . G \equiv {E,g_1 , g_2 , ...} G ≡ E , g 1 , g 2 , . . . ,并赋予这些元素一定的乘法运算规则 g i g j g_i g_j g i g j ,如果元素相乘满足下列群规则,则集合 G G G 构成一个群.
(1)群的闭合性:若 g i , g j ∈ G g_i , g_j \in G g i , g j ∈ G ,则 g k = g i , g j ∈ G g_k =g_i , g_j \in G g k = g i , g j ∈ G .
(2)乘法的结合律: g i ( g j g k ) = ( g i g j ) g k g_i (g_j g_k)=(g_i g_j)g_k g i ( g j g k ) = ( g i g j ) g k .
(3)存在单位元素 E E E ,使得所有元素满足 E g i = g i Eg_i = g_i E g i = g i .
(4)对于任意元素 g i g_i g i ,存在逆元素 g i − 1 g_i^{-1} g i − 1 ,满足 g i g i − 1 = E g_i g_i^{-1} = E g i g i − 1 = E .
一般来说除了阿贝尔群,群元素不具备乘法交换律 g i g j ≠ g j g i g_i g_j \neq g_j g_i g i g j = g j g i .
一个晶体具有的所有对称操作满足上述群的定义,构成一个操作群.乘法运算就是连续操作,单位元素为不动操作(转角为0的旋转加上平移矢量为0的平移),逆元素为转角和平移矢量大小相等、方向相反的操作,中心反演的逆元素还是中心反演.
晶体的所有对称操作包括平移对称操作和点群对称操作,以及它们的组合,晶体的一般对称操作可写为
r ′ = g r = { A ∣ t } r = A t + t \boldsymbol{r^{'} }=g\boldsymbol{r}=\left \{\boldsymbol{A}|\boldsymbol{t} \right\} \boldsymbol{r}=\boldsymbol{A}\boldsymbol{t} + \boldsymbol{t}
r ′ = g r = { A ∣ t } r = A t + t
其中 A \boldsymbol{A} A 表示点对称操作, t \boldsymbol{t} t 表示平移.
(1)由一般操作 { A ∣ t } \left \{\boldsymbol{A}|\boldsymbol{t} \right\} { A ∣ t } (平移+旋转)组合构成的群称为空间群,它是晶体的完全对称群.
(2)当 t = 0 \boldsymbol{t}=0 t = 0 时,由非平移操作 { A ∣ 0 } \left \{\boldsymbol{A}|0 \right\} { A ∣ 0 } 组合构成的群称为点群,它是空间群的一个子群.
(3)当 A = E \boldsymbol{A}=E A = E , t = R l \boldsymbol{t}=\boldsymbol{R_l} t = R l 时,由纯平移操作组合的群称为平移群,它也是空间群的一个子群.
如果一些晶体具有相同的一组群元素,那么就对称性而言,它们将属于同一类晶体.若先忽略结构中基元的对称性,仅考虑点阵的对称性.此时对称操作为 { A ∣ R l } \left \{\boldsymbol{A}|\boldsymbol{R_l} \right\} { A ∣ R l } .若先不考虑平移对称,即取 R l = 0 \boldsymbol{R_l}=0 R l = 0 ,那么操作 { A ∣ 0 } \left \{\boldsymbol{A}|0 \right\} { A ∣ 0 } 便构成点阵的点群,由于点阵的宏观对称操作数和对称素的组合受到平移对称性的严格限制,群论严格证明,仅仅存在7种不同的点群,称为7个晶系.也就是说,点阵按照宏观对称性可分为7类.
(1)三斜晶系.
a ≠ b ≠ c , α ≠ β ≠ γ a \neq b \neq c , \alpha \neq \beta \neq \gamma
a = b = c , α = β = γ
该晶系对应的点群称 C i C_i C i 群,它具有对称素 E ( 1 ) E(1) E ( 1 ) 和 i ( 1 ‾ ) i(\overline{1}) i ( 1 ) ,包含两个群元素.
(2)单斜晶系.
a ≠ b ≠ c α = β = π 2 ≠ γ \begin{array} {c}a\neq b\neq c \\ \\ \alpha=\beta=\frac{\pi}{2}\neq\gamma\end{array}
a = b = c α = β = 2 π = γ
该晶系对应的点群记为 C 2 h C_{2h} C 2 h ,它具有一个2次轴和 i i i ,包含4个群元素.
(3)正交晶系.
a ≠ b ≠ c α = β = γ = π 2 \begin{array} {c}a\neq b\neq c \\ \\ \alpha=\beta=\gamma=\frac{\pi}{2}\end{array}
a = b = c α = β = γ = 2 π
该晶系对应的点群记为 D 2 h D_{2h} D 2 h ,它具有三个2次轴和 i i i ,包含8个群元素.
(4)四方晶系.
a = b ≠ c α = β = γ = π 2 \begin{array} {c}a= b\neq c \\ \\ \alpha=\beta=\gamma=\frac{\pi}{2}\end{array}
a = b = c α = β = γ = 2 π
该晶系对应的点群记为 D 4 h D_{4h} D 4 h ,它具有一个4次轴,四个2次轴和 i i i ,包含16个群元素.
(5)六角晶系.
a = b ≠ c , α = β = π 2 , γ = 2 π 3 \begin{aligned}a & =b\neq c, \\ \\ \alpha & =\beta=\frac{\pi}{2},\quad\gamma=\frac{2\pi}{3}\end{aligned}
a α = b = c , = β = 2 π , γ = 3 2 π
该晶系对应的点群记为 D 6 h D_{6h} D 6 h ,它除了具有一个6次轴和 i i i 外,还有6个与6次轴垂直的2次轴,包含24个群元素.
(6)立方晶系.
a = b = c , α = β = γ = π 2 a=b=c,\alpha = \beta = \gamma =\frac{\pi}{2}
a = b = c , α = β = γ = 2 π
该晶系对应的点群记为 O h O_h O h ,它具有三个4次轴,四个4次轴,六个2次轴,包含48个群元素,时晶体的最高对称点群.
(7)三角晶系.
a = b = c , α = β = γ < 12 0 ∘ ≠ 9 0 ∘ a=b=c,\alpha = \beta =\gamma < 120^\circ \neq 90^\circ
a = b = c , α = β = γ < 1 2 0 ∘ = 9 0 ∘
该晶系对应的点群记为 D 3 d D_{3d} D 3 d ,它具有一个3次轴,三个与3次轴垂直的2次轴和 i i i ,包含12个群元素.
除了考虑点群对称操作,再加上平移对称操作,可以证明所有操作 { A ∣ R l } \left \{\boldsymbol{A}|\boldsymbol{R_l} \right\} { A ∣ R l } 构成14种不同的空间群.即从完整对称性的观点来看存在14种不同的点阵.至于证明过程这里不作推导,书上是使用加心操作来通过7个晶系演绎出14种点阵,感兴趣的可以去看书.
由于上面仅考虑了点阵的对称性,未考虑基元的对称性.结点是一个数学点,它有着完全的对称性,而不同的基元有着不同的对称性.因此若考虑基元,则结构的对称群数目将大大增加.这里不去论证其来源,可知共有32种晶体学点群,230种晶体学空间群,并且还存在两种新的对称素(螺旋轴与滑移反映面).具体的点群与空间群分类可以去查阅书籍.
6. 晶体X射线衍射
由于晶体的周期性结构,因此会对X射线产生衍射图样.考虑间距为 d d d 的平行点阵平面,入射和反射X射线束位于平面内.相邻平面的反射光光程差为 $2d sin \theta $ ,其中 θ \theta θ 从反射平面开始量度.当光程差是波长 λ \lambda λ 的整数倍时,来自相邻平面的辐射就发生相长干涉,所以
2 d s i n θ = n λ 2d sin \theta = n \lambda
2 d s i n θ = n λ
这就是布拉格公式,其中 n n n 是衍射级数,它表示同一族晶面,在不同入射角下的衍射.只有在满足该式的那些反射角的情况下才能观测到强的反射束.但它只能给出衍射加强的条件,不能给出衍射强度的分布.
而由劳厄定理则不仅可以得到衍射条件,也能得到衍射强度分度.至于过程这里不作推导.总之可证明
u k → k ′ = c ∑ h n ( K h ) δ k → k ′ , K h u_{\boldsymbol{k}\to \boldsymbol{k^{'} } } =c\sum_{h}n(\boldsymbol{K_h})\delta _{\boldsymbol{k}\to \boldsymbol{k^{'} } ,\boldsymbol{K_h} }
u k → k ′ = c h ∑ n ( K h ) δ k → k ′ , K h
即一组倒格矢 K h \boldsymbol{K_h} K h 确定可能的X射线衍射(注意是可能),衍射强度正比于电子密度分布函数的傅里叶分量. I k → k ′ = ∣ u k → k ′ ∣ 2 = c 2 ∣ n ( K h ) ∣ 2 \boldsymbol{I_{\boldsymbol{k}\to \boldsymbol{k^{'} } } }= |u_{\boldsymbol{k}\to \boldsymbol{k^{'} } }|^2 =c^2 |n(\boldsymbol{K_h})|^2 I k → k ′ = ∣ u k → k ′ ∣ 2 = c 2 ∣ n ( K h ) ∣ 2 $.如果固定 k \boldsymbol{k} k ,即入射光束是单色和方向一定的平行光,那么仅当波矢满足
S = k ′ − k = K h \boldsymbol{S}=\boldsymbol{k^{'} }-\boldsymbol{k}=\boldsymbol{K_h}
S = k ′ − k = K h
时,可以观察到衍射束,该方程称为劳厄方程.实质上它是光子在周期结构中传播时,动量守恒的体现.光子将动量 ℏ K h \hbar \boldsymbol{K_h} ℏ K h 转移给了晶体,但由于晶体质量太大,以至于观察不到晶体的平动.并且由劳厄方程也可推得布拉格方程,这里不作推导.
由于前面已经提到X射线的衍射强度取决于电子密度分布函数的傅里叶分量.书上讨论了三种电子密度的模型,分别是点散射模型(每个正点阵的结点上有一个电子),原子散射模型(每个正点阵的结点上有一个原子且电子密度用局域电子密度描述),复式晶格模型(在原子散射模型上讨论每个元胞不止一个原子的情况).其中第三种为最一般的情况,由第二种和第三种模型可以推得原子散射因子与几何结构因子.这里仅讨论几何结构因子.则在最一般的情况下,劳厄定理写作:
u k → k ′ = ∑ h c N F ( K h ) δ k → k ′ , K h = { c N F ( K h ) , 当 k ′ − k = K h 时 0 , 其他情况 u_{\boldsymbol{k}\to \boldsymbol{k^{'} } }=\sum_{h}cNF(\boldsymbol{K_h})\delta _{\boldsymbol{k}\to \boldsymbol{k^{'} } ,\boldsymbol{K_h} }= \begin{cases} cNF(\boldsymbol{K_h}), & \text{当}\boldsymbol{k^{'} }-\boldsymbol{k}=\boldsymbol{K_h}\text{时} \\ 0, & \text{其他情况} & \end{cases}
u k → k ′ = h ∑ c N F ( K h ) δ k → k ′ , K h = { c N F ( K h ) , 0 , 当 k ′ − k = K h 时 其他情况
实际应用中,总是将 r i \boldsymbol{r_i} r i 和 K h \boldsymbol{K_h} K h 利用正点阵和倒点阵的基矢表示为
r i = x i 1 a 1 + x i 2 a 2 + x i 3 a 3 \boldsymbol{r_i}=x_{i1}\boldsymbol{a_1}+x_{i2}\boldsymbol{a_2}+x_{i3}\boldsymbol{a_3}
r i = x i 1 a 1 + x i 2 a 2 + x i 3 a 3
K h = h 1 b 1 + h 2 b 2 + h 3 b 3 \boldsymbol{K_h}=h_{1}\boldsymbol{b_1}+h_{2}\boldsymbol{b_2}+h_{3}\boldsymbol{b_3}
K h = h 1 b 1 + h 2 b 2 + h 3 b 3
则几何解构因子可改写为
F ( K h ) = ∑ i f i ( K h ) e − 2 π i ( h 1 x i 1 + h 2 x i 2 + h 3 x i 3 ) F(\boldsymbol{K_h})=\sum_{i}f_i (\boldsymbol{K_h})e^{-2\pi i(h_1 x_{i1}+ h_2 x_{i2} + h_3 x_{i3})}
F ( K h ) = i ∑ f i ( K h ) e − 2 π i ( h 1 x i 1 + h 2 x i 2 + h 3 x i 3 )
因此可得即使在满足劳厄方程 k ′ − k = K h \boldsymbol{k^{'} }-\boldsymbol{k}=\boldsymbol{K_h} k ′ − k = K h 时,如果几何结构因子 F ( K h ) ≡ 0 F(\boldsymbol{K_h}) \equiv 0 F ( K h ) ≡ 0 ,也可能导致衍射幅为0,可见几何结构因子能使空间点阵所允许得某些反射抵消,称为衍射消光.在书上还给出了一些结构的晶体的衍射消光条件的例子,这部分可自行看书.
同时也需注意当用单胞晶轴 a \boldsymbol{a} a , b \boldsymbol{b} b , c \boldsymbol{c} c 代替基矢 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 时,由于单胞是一个扩大了的元胞, a \boldsymbol{a} a , b \boldsymbol{b} b , c \boldsymbol{c} c 的尺度总是大于 a 1 \boldsymbol{a_1} a 1 , a 2 \boldsymbol{a_2} a 2 , a 3 \boldsymbol{a_3} a 3 的尺度,相应的倒点阵基矢 a ∗ \boldsymbol{a^{*} } a ∗ , b ∗ \boldsymbol{b^{*} } b ∗ , c ∗ \boldsymbol{c^{*} } c ∗ 总是小于 b 1 \boldsymbol{b_1} b 1 , b 2 \boldsymbol{b_2} b 2 , b 3 \boldsymbol{b_3} b 3 .则由倒空间平移矢量 K h k l = h a ∗ + k b ∗ + l c ∗ \boldsymbol{K_{hkl} }=h\boldsymbol{a^{*} } +k\boldsymbol{b^{*} } +l\boldsymbol{c^{*} } K h k l = h a ∗ + k b ∗ + l c ∗ 所得到的倒点阵不是真正的倒点阵,它将导致多余的倒结点.则此时劳厄方程将是不完全正确的衍射加强条件,必须用几何结构因子 F ( K h ) F(\boldsymbol{K_h}) F ( K h ) 进行修正.
埃瓦尔德构图法有助于我们了解各种衍射方法,并根据观察到的衍射斑去推断晶体的结构特征.在倒空间取一倒结点为原点 O O O .以入射波矢 k \boldsymbol{k} k 的末端为球心, ∣ k ∣ |\boldsymbol{k}| ∣ k ∣ 为半径画一个球,要求 k \boldsymbol{k} k 的始端落在 O O O 点,当倒点阵和人射波矢一定时,只能画出唯一的一个球,称为埃瓦尔德球.如果除了原点外,还有一些倒格点落在球面上,将存在一些 k ′ \boldsymbol{k^{'} } k ′ ,满足劳厄方程: k ′ − k = K h \boldsymbol{k^{'} }-\boldsymbol{k}=\boldsymbol{K_h} k ′ − k = K h ,也就存在一些来源于垂直于 K h \boldsymbol{K_h} K h 的点阵面的布拉格反射.
如果希望在实验上容易看到衍射峰,则必须放松固定 k \boldsymbol{k} k 的限制.即变化 k \boldsymbol{k} k 的大小(改变X射线的波长),或者 变化 k \boldsymbol{k} k 的方向(X射线对晶体的入射角).对于前者有劳厄法,即连续改变 k \boldsymbol{k} k 的大小,则可作无穷多埃瓦尔德球.对于后者则有旋转晶体法和粉末法,其相当于改变 k \boldsymbol{k} k 的方向,即埃瓦尔德球固定,但每个倒格点在 k \boldsymbol{k} k 空间内运动.除此之外还有电子衍射和中子衍射等,其中中子还具有自旋,可用来检测材料的磁结构.
7. 准晶体
准晶体这个其实挺有意思的,还与斐波那契(Fibonacci)数列相关,这个我在这里就不写了,以后会单开一篇来写.
第二章 晶体的结合
1. 原子的电负性
这部分想必都早在化学中学过了,也都是些老生常谈的东西,这里就不作介绍了.
2. 晶体结合的类型
首先是金属键结合.当负电性很小的元素结合成晶体时,价电子倾向于共有化,使之在整个晶体中游荡.电子退局域其动能将减小,这个量子效应是金属内聚力的主要来源.书上采用了一个简单的例子来说明这个现象,这里就只把图放出来了.
由于金属晶体中价电子共有化,可以抽象出一个既简单又基本符合真实情况的金属模型,即浸泡在负电子云中,带正电荷的离子实系统.电子退局域本身使系统的动能降低,而电子云与正离子之间的库仑吸引使原子聚合起来.显然晶体的体积越小,电子云的密度越大,库仑相互作用越低.但是体积越小,电子云密度增大,系统的费米能,即系统的动能将增加,表现出排斥相互作用.于是金属结合首先是一种体积效应,而对原子的排列没有特殊要求.金属的基本特性,如高导电性、高导热性、大的延展性(范性)、金属光泽,都与金属结合的电子共有化密切相关.
然后是共价键结合.负电性较强的元素结合时多采用共价键结合.以两个氢原子的结合为例,若略去电子自旋和自旋-轨道相互作用,则在满足费米子交换反对称的要求下,其波函数有两种形式
Φ I ( r 1 , r 2 ) = c 1 [ φ a ( r 1 ) φ b ( r 2 ) + φ a ( r 2 ) φ b ( r 1 ) ] χ A \Phi_{I}(r_{1},r_{2})=c_{1}[\varphi_{a}(r_{1})\varphi_{b}(r_{2})+\varphi_{a}(r_{2})\varphi_{b}(r_{1})]\chi_{A}
Φ I ( r 1 , r 2 ) = c 1 [ φ a ( r 1 ) φ b ( r 2 ) + φ a ( r 2 ) φ b ( r 1 ) ] χ A
Φ I I ( r 1 , r 2 ) = c 2 [ φ a ( r 1 ) φ b ( r 2 ) − φ a ( r 2 ) φ b ( r 1 ) ] χ S \Phi_{II}(r_{1},r_{2})=c_{2}[\varphi_{a}(r_{1})\varphi_{b}(r_{2})-\varphi_{a}(r_{2})\varphi_{b}(r_{1})]\chi_{S}
Φ I I ( r 1 , r 2 ) = c 2 [ φ a ( r 1 ) φ b ( r 2 ) − φ a ( r 2 ) φ b ( r 1 ) ] χ S
其中 c 1 c_1 c 1 , c 2 c_2 c 2 为归一化常数,角标 a a a , b b b 分别代表两个原子,角标 1 1 1 , 2 2 2 分别表示两个电子, χ S \chi_{S} χ S 和 χ A \chi_{A} χ A 分别代表电子自旋体系的对称和反对称波函数.则由总的电子波函数的交换反对称性, Φ I \Phi_{I} Φ I 为自旋单态, Φ I I \Phi_{II} Φ I I 为自旋三重态.由 E = ∫ Φ ∗ ( r 1 , r 2 ) H ^ Φ ( r 1 , r 2 ) d r 1 d r 2 E=\int \Phi^{*}(r_1,r_2)\hat{H}\Phi(r_1,r_2)dr_1 dr_2 E = ∫ Φ ∗ ( r 1 , r 2 ) H ^ Φ ( r 1 , r 2 ) d r 1 d r 2 可计算得自旋单态和三重态得能量,它们可简单地表示为
E I = K + J E_{I}=K+J
E I = K + J
E I I = K − J E_{II}=K-J
E I I = K − J
其中 K K K 表示两个原子之间得库伦相互作用能,而 J J J 为交换能.对于氢分子, J < 0 J<0 J < 0 ,因此单态能量低于三重态,氢分子基态正是采用这个状态.由图可知对于三重态无法构成稳定分子,称为反成键态,而单态存在一极小值,对应量原子组成分子后相互吸引,称为成键态.
单态能量低由于在两个核之间的低势区 ∣ Φ I ∣ 2 |\Phi_{I}|^2 ∣ Φ I ∣ 2 大,两个自旋反平行的电子处于此地的概率大,而在此区域 ∣ ∇ Φ I ∣ 2 |\nabla \Phi_{I}|^2 ∣ ∇ Φ I ∣ 2 小,电子的动能小.于是根据泡利原理,自旋取向的不同,决定了电子空间分布的不同,从而影响了库仑静电作用.由此可见共价键结合从实质上来说仍然是库仑静电作用,不过是一种量子效应.因此将两个原子共有的自旋反平行的一对电子结构称为共价键.
不仅如此由于形成共价键的数目取决于未填满的价电子数,此称为共价键的饱和性.并且共价键总在电子波函数最大重叠的方向成键,此称为共价键的方向性.
除此之外对于共价键还存在 s p 3 sp^3 s p 3 杂化的可能性.例如金刚石的碳原子的2s与2p轨道的能量接近使得一个2s电子激发到2p态,由此产生4个未配对的电子: φ 2 s \varphi_{2s} φ 2 s , φ 2 p x \varphi_{2p_{x} } φ 2 p x , φ 2 p y \varphi_{2p_{y} } φ 2 p y , φ 2 p z \varphi_{2p_{z} } φ 2 p z .然后由这四个波函数重新组成四个归一化的波函数:
ψ 1 = 1 2 ( φ 2 s + φ 2 p x + φ 2 p y + φ 2 p z ) \psi _1=\frac{1}{2}(\varphi_{2s}+\varphi_{2p_{x} }+\varphi_{2p_{y} }+\varphi_{2p_{z} })
ψ 1 = 2 1 ( φ 2 s + φ 2 p x + φ 2 p y + φ 2 p z )
ψ 2 = 1 2 ( φ 2 s + φ 2 p x − φ 2 p y − φ 2 p z ) \psi _2=\frac{1}{2}(\varphi_{2s}+\varphi_{2p_{x} }-\varphi_{2p_{y} }-\varphi_{2p_{z} })
ψ 2 = 2 1 ( φ 2 s + φ 2 p x − φ 2 p y − φ 2 p z )
ψ 3 = 1 2 ( φ 2 s − φ 2 p x + φ 2 p y − φ 2 p z ) \psi _3=\frac{1}{2}(\varphi_{2s}-\varphi_{2p_{x} }+\varphi_{2p_{y} }-\varphi_{2p_{z} })
ψ 3 = 2 1 ( φ 2 s − φ 2 p x + φ 2 p y − φ 2 p z )
ψ 1 = 1 2 ( φ 2 s − φ 2 p x − φ 2 p y + φ 2 p z ) \psi _1=\frac{1}{2}(\varphi_{2s}-\varphi_{2p_{x} }-\varphi_{2p_{y} }+\varphi_{2p_{z} })
ψ 1 = 2 1 ( φ 2 s − φ 2 p x − φ 2 p y + φ 2 p z )
这样将原来 φ 2 s \varphi_{2s} φ 2 s , φ 2 p x \varphi_{2p_{x} } φ 2 p x , φ 2 p y \varphi_{2p_{y} } φ 2 p y , φ 2 p z \varphi_{2p_{z} } φ 2 p z 轨道上的四个电子分别放在沿四面体顶角方向的四个状态 ψ 1 \psi _1 ψ 1 , ψ 2 \psi _2 ψ 2 , ψ 3 \psi _3 ψ 3 , ψ 4 \psi _4 ψ 4 上,都是未配对的,可形成四个共价键,且键角相同.而 s p 3 sp^3 s p 3 杂化所需的能量将有形成共价键时的能量降低所补偿.共价键也是一种强健,也就是成键的电子很难被激发而游离,因此共价晶体多是绝缘体或半导体.例如金刚石是最典型的绝缘体且硬度极高,而 S i Si S i , G e Ge G e 则是典型的半导体.
除此之外当负电性不同的原子组成共价键时,电子会靠近负电性大的原子一侧,分子显示出电偶极矩,称为极性共价键.
之后是离子键结合.当两个负电性相差很大的元素结合时,成键电子全部或大部从一种原子迁移到另一种原子上,形成正、负离子.这种依靠正、负离子间库仑吸引的结合称为离子键.有些结合很难严格区分它是共价键和离子键.由于正、负离子具有稳定的闭合壳层,可以认为正、负离子之间的吸引是经典的库仑吸引.在满壳层的离子相互接近到电子云明显渗入的情况下,由于泡利原理产生排斥,这显然是量子效应.吸引和排斥的竞争决定了平衡时的离子间距.离子键没有饱和性,也没有方向性.
再然后是范德瓦尔斯键结合.即通过原子和分子间的相互作用成键,这种作用力相较于金属键,共价键,化学键要弱的多,称为范德瓦尔斯(van der Waals)力.其原因是由于电子存在着零点运动,导致瞬时电偶极矩的产生,这个电偶极子又可以在近邻原子中感生电偶极矩,于是两个偶极子之间将产生动力学上的相互关联.如图所示:(a)表示两个平行的电偶极矩,其库仑势为负,表现为吸引互作用,(b)表示两个反平行的电偶极矩,其库仑势为正,表现为排斥互作用.根据量子力学的变分法可得到(a)出现的概率略大于(b)出现的概率,因此吸引占优势.这种吸引力就是范德瓦尔斯力.在书上作者采用了一个简化的模型,即考虑了两个相距一定距离的全同线性谐振子(振子带有异号电荷),利用简正坐标使得哈密顿量对角化,使得两个耦合的谐振子脱耦,最后得出了系统能量降低的结论,即这是一种吸引相互作用,且与距离的6次方成反比( Δ E ( r ) = − A r 6 \Delta E(r)=-\frac{A}{r^6} Δ E ( r ) = − r 6 A ).感兴趣的可以看书.
其次是氢键.氢键能在氢原子与两个负电性很大且原子半径较小的原子之间形成.具体的还是去看书吧.
除此之外还有许多分子或晶体的结合不单纯属于上述五种之一,属于综合性的.比如金刚石的同素异形体石墨,对于碳来说除了能形成 s p 3 sp^3 s p 3 杂化,其也能形成少于四个键的杂化,如 s s s 态可以与 p x p_x p x , p y p_y p y 组合,构成在 x − y x-y x − y 平面内三个等价的,归一化的 s − p s-p s − p 杂化轨道波函数:
ψ 1 = 1 3 ( φ 2 s + 2 φ 2 p x ) \psi _1=\frac{1}{\sqrt{3} }(\varphi_{2s}+\sqrt{2}\varphi_{2p_{x} })
ψ 1 = 3 1 ( φ 2 s + 2 φ 2 p x )
ψ 2 = 1 6 ( 2 φ 2 s + 3 φ 2 p y − φ 2 p x ) \psi _2=\frac{1}{\sqrt{6} }(\sqrt{2}\varphi_{2s}+\sqrt{3}\varphi_{2p_{y} }-\varphi_{2p_{x} })
ψ 2 = 6 1 ( 2 φ 2 s + 3 φ 2 p y − φ 2 p x )
ψ 3 = 1 6 ( 2 φ 2 s − 3 φ 2 p y − φ 2 p x ) \psi _3=\frac{1}{\sqrt{6} }(\sqrt{2}\varphi_{2s}-\sqrt{3}\varphi_{2p_{y} }-\varphi_{2p_{x} })
ψ 3 = 6 1 ( 2 φ 2 s − 3 φ 2 p y − φ 2 p x )
这三个杂化轨道指向三角形的三个顶角.这个对称性较低的态称为 s p 2 sp^2 s p 2 杂化轨道.此时 p z p_z p z 态保持不变垂直于纸面
许多碳原子依靠 s p 2 sp^2 s p 2 杂化轨道共价结合,排列成平面蜂窝状结构.在每一层内,每个原子多余的 p z p_z p z 电子,形成金属键.层与层之间依靠范德瓦耳斯键,结合成三维石墨晶体,因此,石墨像是一种二维金属,仅在这些层的平面内具有良好的导电性.由于石墨结构的层间结合很弱,因而易于解理.使石墨具有润滑性.在课本上还举了 C 60 C_{60} C 6 0 ,碳纳米管,石墨烯的例子,这里就不赘述了,感兴趣的可以看书.
3. 结合能
从上面的讨论可以得知要严格地从薛定湾方程出发解决晶体的结合问题是相当困难的.例如,关于金属结合能和晶格常量的详细计算,可以追溯到20世纪30年代的W-S元胞法和近年来发展的局域密度泛函理论.但是除此之外,物理学中还有另一种解决问题的途径,就是采用实验和理论相结合的唯象方法.那么由系统内能与结合能之间的关系再结合热力学定律与宏观可测量可以得到两个能与可测量联系起来的式子(具体推导见书):
d U d V ∣ V 0 = 0 \left.\frac{\mathrm{d}U}{\mathrm{d}V}\right|_{V_0}=0
d V d U ∣ ∣ ∣ ∣ V 0 = 0
该式将晶体的内能函数 U U U 与晶体的平衡体积 V 0 V_0 V 0 或平衡晶格常量 a 0 a_0 a 0 联系起来.
B = V d 2 U d V 2 B=V\frac{\mathrm{d}^2U}{\mathrm{d}V^2}
B = V d V 2 d 2 U
该式将晶体的内能函数 U U U 与晶体的体弹模量 B B B 联系起来.
离子晶体由具有闭合电子壳层的正、负离子相间排列组成.离子键由电荷异号的离子间静电库仑相互作用产生.书上以 N a C l NaCl N a C l 晶体为例列出了一对正负离子(或一个元胞)的平均库伦能(经典吸引势能)为
1 4 π ε 0 e 2 r ∑ n 1 , n 2 , n 3 ′ ( − 1 ) n 1 + n 2 + n 3 ( n 1 2 + n 2 2 + n 3 2 ) 1 / 2 = − 1 4 π ε 0 α e 2 r \frac{1}{4\pi\varepsilon_{0} }\frac{e^{2} }{r}\sum_{n_{1},n_{2},n_{3} }^{\prime}\frac{(-1)^{n_{1}+n_{2}+n_{3} } }{(n_{1}^{2}+n_{2}^{2}+n_{3}^{2})^{1/2} }=-\frac{1}{4\pi\varepsilon_{0} }\frac{\alpha e^{2} }{r}
4 π ε 0 1 r e 2 n 1 , n 2 , n 3 ∑ ′ ( n 1 2 + n 2 2 + n 3 2 ) 1 / 2 ( − 1 ) n 1 + n 2 + n 3 = − 4 π ε 0 1 r α e 2
其中 α = − ∑ n 1 , n 2 , n 3 ′ ( − 1 ) n 1 + n 2 + n 3 ( n 1 2 + n 2 2 + n 3 2 ) 1 / 2 \alpha =-\sum_{n_{1},n_{2},n_{3} }^{\prime}\frac{(-1)^{n_{1}+n_{2}+n_{3} } }{(n_{1}^{2}+n_{2}^{2}+n_{3}^{2})^{1/2} } α = − ∑ n 1 , n 2 , n 3 ′ ( n 1 2 + n 2 2 + n 3 2 ) 1 / 2 ( − 1 ) n 1 + n 2 + n 3 称为马德隆(Madelung)常数.它完全取决于晶体结构,是一个无量纲量.由于求和总体为负数,所以 α \alpha α 为正数.该式就是离子晶体平均每一个元胞所具有的长程库仑吸引势,它与 r r r 的一次方成反比,称为马德隆能.
而离子晶体的排斥能起因于满壳层离子之间电子云的交叠,它将导致电子向高能态激发.重叠排斥能显然是一种量子效应.由于重叠排斥是短程互作用,它总可以写成随离子间距陡峻衰减的函数 b / r n b/r^n b / r n , 其中 b b b 和 n n n 为待定量.对于 N a C l NaCl N a C l 结构,只考虑最近邻离子电子云的重叠,每个离子周围有6个近邻,一对离子(或一个元胞)的平均排斥能为
6 b r n \frac{6b}{r^n}
r n 6 b
设晶体中有 N N N 个元胞,则晶体的内能函数为:
U = N ( − 1 4 π ε 0 α e 2 r + 6 b r n ) = N ( − A 1 r + A n r n ) U=N(-\frac{1}{4\pi \varepsilon_{0} } \frac{\alpha e^2}{r} +\frac{6b}{r^n})=N(-\frac{A_1}{r}+\frac{A_n}{r^n})
U = N ( − 4 π ε 0 1 r α e 2 + r n 6 b ) = N ( − r A 1 + r n A n )
其中, A 1 = α e 2 4 π ε 0 A_1 =\frac{\alpha e^2}{4\pi \varepsilon_{0} } A 1 = 4 π ε 0 α e 2 , A n = 6 b A_n =6b A n = 6 b .若已知晶体的体弹模量 B B B 与平衡晶格参量 r 0 r_0 r 0 ,则可由内能函数与宏观可测量的关系得到带定量 n n n 与 b b b ,即对于 N a C l NaCl N a C l 晶体有 A n A 1 = 1 n r 0 n − 1 \frac{A_n}{A_1}=\frac{1}{n}r_0^{n-1} A 1 A n = n 1 r 0 n − 1 , B = ( n − 1 ) α e 2 4 π ε 0 18 r 0 4 B=\frac{(n-1)\alpha e^2}{4\pi \varepsilon_{0} 18 r_0^4} B = 4 π ε 0 1 8 r 0 4 ( n − 1 ) α e 2 .则晶体的结合能为
W = − U ( r 0 ) = N A 1 r 0 ( 1 − 1 r 0 n − 1 A n A 1 ) = 1 4 π ε 0 N α e 2 r 0 ( 1 − 1 n ) \begin{aligned} \mathrm{W} & =-U(r_{0})=\frac{NA_{1} }{r_{0} }\left (1-\frac{1}{r_{0}^{n-1} }\frac{A_{n} }{A_{1} }\right) \\ & =\frac{1}{4\pi\varepsilon_{0} }\frac{N\alpha e^{2} }{r_{0} }\left(1-\frac{1}{n}\right) \end{aligned}
W = − U ( r 0 ) = r 0 N A 1 ( 1 − r 0 n − 1 1 A 1 A n ) = 4 π ε 0 1 r 0 N α e 2 ( 1 − n 1 )
可见离子晶体的结合能主要来自库伦静电能,排斥能只占 1 / n 1/n 1 / n .而关于马德隆常数的计算则可使用埃夫琴(H.M.Evjen)等人提出的快速收敛的计算方法.即将晶体划分成一系
列中性单元,每个单元既没有纯电荷也没有偶极子.这样当计算参考离子所在单元与其他单元间的库仑作用时,各个单元的贡献随着距离的增加而迅速衰减.所以往往只需在少数几个中性单元中求 α \alpha α , 就可得到相当准确的 α \alpha α 值.
而对于惰性气体原子则依靠范德瓦尔斯键结合称晶体,原子的吸引势为谐振子近似下给出的 − A 6 / r 6 -A_6/r^6 − A 6 / r 6 .而当原子间距足够近时,电子云的交叠导致泡利排斥势的出现.当两个具有闭合壳层的原子电荷交叠时,B原子的电子倾向于部分占据A原子的某些态,后者本来已为A原子的电子所占据,A原子对B原子态也有同样的倾向.泡利原理阻止多重占据.因此,电子云的交叠必须伴随部分电子激发到原子未被占据的高能态,使系统的总能量增加,对相互作用给出排斥性贡献.这里不从基本原理出发来计算排斥相互作用,只是给出一个 A 12 / r 12 A_{12}/r^{12} A 1 2 / r 1 2 形式的经验排斥势.将它与吸引势结合,给出间距为 r r r 的两个原子总的经验势:
V ( r ) = − A 6 r 6 + A 12 r 12 V(r)=-\frac{A_6}{r^6}+\frac{A_{12} }{r^{12} }
V ( r ) = − r 6 A 6 + r 1 2 A 1 2
其中, A 6 A_6 A 6 与 A 12 A_{12} A 1 2 为两个待定常量,通常令 4 ε σ 6 = A 6 4\varepsilon \sigma^6 =A_6 4 ε σ 6 = A 6 , 4 ε σ 12 = A 12 4\varepsilon \sigma^{12} =A_{12} 4 ε σ 1 2 = A 1 2 ,则上式可写为
V ( r ) = 4 ε [ ( σ r ) 12 − ( σ r ) 6 ] V(r)=4\varepsilon [(\frac{\sigma}{r})^{12}-(\frac{\sigma}{r})^6]
V ( r ) = 4 ε [ ( r σ ) 1 2 − ( r σ ) 6 ]
称为伦纳德-琼斯(Lennard-Jones)势, ε \varepsilon ε 表示势能的强度, σ \sigma σ 表示相互作用力的方程.
如果晶体包含 N N N 个原子,则总的内能函数为:
U ( r ) = 1 2 N ( 4 ε ) [ ∑ j ′ ( σ P 0 j r ) 12 − ∑ j ′ ( σ P 0 j r ) 6 ] U(r)=\frac{1}{2}N(4\varepsilon) \Big[ \sum_{j} '\Big(\frac{\sigma}{P_{0j}r}\Big)^{12} - \sum_{j} '\Big(\frac{\sigma}{P_{0j}r}\Big)^{6} \Big]
U ( r ) = 2 1 N ( 4 ε ) [ j ∑ ′ ( P 0 j r σ ) 1 2 − j ∑ ′ ( P 0 j r σ ) 6 ]
其中 P 0 j r P_{0j}r P 0 j r 表示参考原子 0 0 0 同其它任一原子 j j j 之间的距离.式中因子 1 / 2 1/2 1 / 2 是因为每项相互作用势为一对原子所共有.求和 ∑ j ′ 1 P 0 j n \sum_{j} '\frac{1}{P_{0j}^n} ∑ j ′ P 0 j n 1 是只与结构有关的参数.由于伦纳德-琼斯势是短程相互作用势因此级数收敛得很快.对于惰性气体晶体同理可由内能函数与两个宏观可测量的关系来确定待定量.这里不再赘述.
由量子力学中的不确定性关系,原子的坐标与动量不能同时精确确定.如果坐标的不确定度为 Δ x = 3 r A \Delta x=3\mathrm{r{A} } Δ x = 3 r A ,那么动量的不确定度 Δ p x ≈ ℏ / Δ x = 0.35 × 1 0 − 24 J ⋅ s / m \Delta p_{_x}\approx\hbar/\Delta x=0.35\times 10^{-24}\mathrm{J}\cdot\mathrm{s/m} Δ p x ≈ ℏ / Δ x = 0 . 3 5 × 1 0 − 2 4 J ⋅ s / m ,零点振动能为 ( Δ p ) 2 / 2 m (\Delta p)^2/2m ( Δ p ) 2 / 2 m ,反比于原子的质量 m m m . H e He H e 是最轻的惰性气体,其 ( Δ p ) 2 / 2 m H e ≈ 2.8 × 1 0 − 23 J (\Delta p)^2/2m_{He}\approx 2.8 \times 10^{-23}\mathrm{J} ( Δ p ) 2 / 2 m H e ≈ 2 . 8 × 1 0 − 2 3 J ,相当于2K温度,因此零点振动对于 H e He H e 表现得特别重要.零点振动能大于原子间的范德瓦尔斯能,导致晶格不稳定.这也是为何液氦难以固化的原因.
写在第三章,第四章前面,因为从这里开始基本就是以推导为主了,由于前面也说过这里不会写推导,所以将主要记录各种处理思想与重要结论.
第三章 晶格动力学和晶体的热学性质
1. 简正模与格波
这里主要用的思想是在简谐近似下讨论晶格的本征振动,即简正模.并利用晶格的周期性证明晶体中的一个简正模可对应一个振幅调制的平面波,称为格波.晶体中,与任意原子振动相关的激发,只是这些本征振动的线性叠加.
其详细的处理与计算方法就不作介绍了,这里仅作一个概述.其大致处理方法是考虑一个有 N N N 个原子的晶体,并引入约化坐标.随后可写出系统的哈密顿量 H H H .之后便对系统作简谐近似,即将势能在平衡位置附近展开并略去势能展开式中的高次项,仅仅保留二次项(由后面可知这会忽略掉导致热膨胀的非谐项).此后再利用系统的拉格朗日函数与正则方程可得到 3 N 3N 3 N 个耦合的振动方程.之后的处理方法就是对第二章范德瓦尔斯势处理的如法炮制,即引入简正坐标使得哈密顿量 H H H 对角化,实现 3 N 3N 3 N 个谐振子的脱耦.至于简正坐标的选取形式则利用线性代数中的知识即可,写出二次型矩阵,求特征向量,构造正交矩阵,然后正交变换得到新基矢.
于是便可以得到在简谐近似下,可以通过引入简正坐标,使系统的哈密顿量对角化,将 3 N 3N 3 N 个耦合的微振动方程变为 3 N 3N 3 N 个独立的谐振子方程,使问题简化.并且每个谐振子以特定的频率 ω \omega ω 振动,它描述体系的集体振动( 3 N 3N 3 N 个 q i q_i q i 同时参与的振动),称为体系的一个简正模.并且所有的简正模都构成一个正交完备集,晶格的任何振动都可以表示为它们的线性组合.将其过渡到量子理论后也可由薛定谔方程得到谐振子势对应的系统本征函数与本征能量.
由于前面在简谐近似下得到了每个原子以特定的频率振动的结论.于是若利用这一振动的结论并结合上晶格的平移对称性,便可以得到周期晶格中的格波解,可证明格波解具有如下形式(具体证明见书)
u = A e i [ q ⋅ R l − ω ( q ) t ] u=Ae^{i[\boldsymbol{q}\cdot \boldsymbol{R_l}-\omega (\boldsymbol{q})t]}
u = A e i [ q ⋅ R l − ω ( q ) t ]
其中 A A A 为原子在偏振方向上的振幅,而 q \boldsymbol{q} q 就是通常意义上的波矢,这是晶格平移对称性的结果.由于晶格的不连续性,波的振幅只在格点的原子上定义,称为格波.
2. 一维单原子链振动
。假定有一个一维简单晶格,每个初基元胞中只包含一个原子,质量为 m m m .平衡时相邻原子间距离为 a a a .原子沿链长方向作纵振动,偏离平衡位置位移为 u l ( l = 0 , ± 1 , ± 2 , . . . , ± ∞ ) u_l(l=0,\pm 1,\pm 2,...,\pm \infty) u l ( l = 0 , ± 1 , ± 2 , . . . , ± ∞ ) .于是在简谐近似下可得第 l l l 个原子的运动方程
m d 2 u l d t 2 = ∑ p β p ( u l + p − u l ) m\frac{\mathrm{d}^{2}u_{l} }{\mathrm{d}t^{2} }=\sum_{p}\beta_{p}(u_{l+p}-u_{l})
m d t 2 d 2 u l = p ∑ β p ( u l + p − u l )
如果仅考虑最近邻原子之间的相互作用,取 p = ± 1 p=\pm 1 p = ± 1 ,则可简化为
m d 2 u l d t 2 = β ( u l + 1 + u l − 1 − 2 u l ) , l = 0 , ± 1 , ± 2 , ⋯ , ± ∞ m\frac{\mathrm{d}^{2}u_{l} }{\mathrm{d}t^{2} }=\beta(u_{l+1}+u_{l-1}-2u_{l}),\quad l=0,\pm1,\pm2,\cdots,\pm\infty
m d t 2 d 2 u l = β ( u l + 1 + u l − 1 − 2 u l ) , l = 0 , ± 1 , ± 2 , ⋯ , ± ∞
于是令上一节求得的格波解为 u l = A e i ( q l a − ω t ) u_{l}=Ae^{i(qla-\omega t)} u l = A e i ( q l a − ω t ) ,并带入上述运动方程便可解得一维单原子链的色散关系:
ω ( q ) = 2 β m ∣ sin ( 1 2 q a ) ∣ \omega(q)=2\sqrt{\frac{\beta}{m} }|\sin\left(\frac{1}{2}qa\right)|
ω ( q ) = 2 m β ∣ sin ( 2 1 q a ) ∣
由这个关系可以很明显得看到格波的群速度 v ( q ) = d ω ( q ) d q v(q)=\frac{d\omega (q)}{dq} v ( q ) = d q d ω ( q ) 也是依赖于波矢或频率的,即存在色散.并且也可得到频谱 ω ( q ) \omega (q) ω ( q ) 是倒空间的周期函数 ω ( q ) = ω ( q + 2 π a h ) = ω ( q + K h ) \omega(q)=\omega\left(q+\frac{2\pi}{a}h\right)=\omega(q+K_{h}) ω ( q ) = ω ( q + a 2 π h ) = ω ( q + K h ) 如图所示
由此也可以看到周期结构中波的传播的主要特点:频谱成带结构.一个单原子链,相当于弹性波的低通滤波器,它的本征频率必须限制在 0 ≤ ω ≤ ω m a x 0\le \omega \le \omega _{max} 0 ≤ ω ≤ ω m a x 范围之内,不存在 ω > ω m a x \omega > \omega _{max} ω > ω m a x 的本征频率,这样的波不能在系统中传播.
除此之外,特别的在长波极限或连续介质极限下,取 q → 0 q\to 0 q → 0 ,色散关系会退化为 ω ( q ) = β m a q = c q \omega (q)=\sqrt{\frac{\beta}{m} }aq=cq ω ( q ) = m β a q = c q ,恰像弹性波在连续介质中传播一样,其中 c = β m a c=\sqrt{\frac{\beta}{m} }a c = m β a 表示声速,它不依赖于频率也就是没有色散.
并且还有结论一个确定的 q q q 和 ω ( q ) \omega (q) ω ( q ) 确定系统的一个简正模,通常用 a l q = 1 N e i q l a a_{lq}=\frac{1}{\sqrt{N} }e^{iqla} a l q = N 1 e i q l a 表示系统的一个简正模.并且由于 q q q 与 q + K h q+K_h q + K h 代表同一振动模,所以可以将所有独立的振动模式所对应的 q q q 限制在一个倒格子元胞范围内.为了对称起见,通常取在第一布里渊区范围内, − π a < q ≤ π a -\frac{\pi}{a}<q \le \frac{\pi}{a} − a π < q ≤ a π .这也是格波与连续介质中的波的主要区别之一. 连续介质对波矢 q q q 是没有限制的.对于晶体,由于平移对称性破缺,波的振幅只在分立格点上有定
义,两个波矢相差一个倒格矢的波,虽然波长不一样,但它们描述格点上原子的运动情况是完全相同的.并且也可以注意到在布里渊区边界处的格波解为一驻波的形式,其群速度为0,在能带论中于布里渊区边界处也可得到驻波解.
在上面的讨论中,充分利用了晶格的平移对称性,原子链应该是无穷长的.但实际晶体总是有限的,对于一个有限的原子链,上面的解原则上不适用,因为有限原子链两端原子的振动方程与内部原子不一致,虽然只是少数方程不同,但由于所有方程必须联立求解,使问题变得复杂起来.为了避免这种情况,玻恩-冯卡门提出周期性边界条件.设想一个包含 N N N 个元胞的原子链,将它首尾相连,构成一个环,如果 N N N 足够大,一个沿着半径极大的环传播的波,等价于一个在无限长原子链中传播的波.于是考虑到圆的循环性,则必须有 A e i ( q l a − ω t ) = A e i [ ( l + N ) a − ω t ] Ae^{i(qla-\omega t)}=Ae^{i[(l+N)a-\omega t]} A e i ( q l a − ω t ) = A e i [ ( l + N ) a − ω t ] 可得
e i q N a = 1 , q N a = 2 π h e^{iqNa}=1, \qquad qNa = 2\pi h
e i q N a = 1 , q N a = 2 π h
其中 h h h 为整数,上述条件称为玻恩-冯卡门边界条件.于是根据该条件可得波矢 q q q 取分立值 q = 2 π h N a , − π a < q ⩽ π a , − N 2 < h ⩽ N 2 q=\frac{2\pi h}{Na},-\frac{\pi}{a}<q\leqslant\frac{\pi}{a},-\frac{N}{2}<h\leqslant\frac{N}{2} q = N a 2 π h , − a π < q ⩽ a π , − 2 N < h ⩽ 2 N .因此波矢 q q q 在第一布里渊区均匀分布,且只能取 N N N 个值.如果定义单位 q q q 空间的波矢数为波矢密度,则可得独立波矢数 = N N N (元胞数),波矢密度 = f r a c N Ω ∗ frac{N}{\Omega ^{*} } f r a c N Ω ∗ = N a 2 π \frac{Na}{2\pi} 2 π N a .除此之外也可证明在玻恩-冯卡门边界条件下所有的独立模式也构成正交完备集.
3. 一维双原子链振动
其处理方法同一维单原子链,只是每个元胞中有2个不同的原子.
m 1 d 2 u l d t 2 = β ( v l + v l − 1 − 2 u l ) m_{1}\frac{\mathrm{d}^{2}u_{l} }{\mathrm{d}t^{2} }=\beta(v_{l}+v_{l-1}-2u_{l})
m 1 d t 2 d 2 u l = β ( v l + v l − 1 − 2 u l )
m 2 d 2 v l d t 2 = β ( u l + 1 + u l − 2 v l ) m_{2}\frac{\mathrm{d}^{2}v_{l} }{\mathrm{d}t^{2} }=\beta(u_{l+1}+u_{l}-2v_{l}) m 2 d t 2 d 2 v l = β ( u l + 1 + u l − 2 v l )
然后同理令格波解 u l = A e i ( q l a − ω t ) u_{l}=Ae^{i(qla-\omega t)} u l = A e i ( q l a − ω t ) .解得一维双原子链得色散关系:
ω ∗ 2 ( q ) = β m 2 + m 1 m 2 m 1 [ 1 ± [ 1 − 4 m 2 m 1 ( m 2 + m 1 ) 2 sin 2 ( 1 2 q a ) ] 1 / 2 ] \omega_{_*}^{2} ( q )=\beta \frac{m_{_2} + m_{_1} }{m_{_2}m_{_1} }\biggl[1 \pm\biggl[ 1 - \frac{4m_{_2}m_{_1} } {\left( m_{_2} + m_{_1} \right)^{2} } \sin^{2}\biggl(\frac{1}{2}qa\biggr) \biggr] ^{1/2}\biggr]
ω ∗ 2 ( q ) = β m 2 m 1 m 2 + m 1 [ 1 ± [ 1 − ( m 2 + m 1 ) 2 4 m 2 m 1 sin 2 ( 2 1 q a ) ] 1 / 2 ]
并且还可以得到轻重原子得振幅之比和复相位:
α ± = ( B A ) ± = − m 1 ω ± 2 ( q ) − 2 β β ( 1 + e − i q a ) \alpha_{\pm}=\left(\frac{B}{A}\right)_{\pm}=-\frac{m_{1}\omega_{\pm}^{2}(q)-2\beta}{\beta(1+\mathrm{e}^{-\mathrm{i}qa})}
α ± = ( A B ) ± = − β ( 1 + e − i q a ) m 1 ω ± 2 ( q ) − 2 β
于是可得对于双原子链,其色散曲线分为了两支,一个确定的 q q q 对应了两个不同的频率 ω ± ( q ) \omega_{\pm}(q) ω ± ( q ) .并且同单原子链对于其中的每一支都有 ω ± ( q ) = ω ± ( q + 2 π h a ) = ω ± ( q + K h ) \omega_{\pm}(q)=\omega_{\pm}\left(q+\frac{2\pi h}{a}\right)=\omega_{\pm}(q+K_{h}) ω ± ( q ) = ω ± ( q + a 2 π h ) = ω ± ( q + K h ) ,因此独立的 q q q 可限制在第一布里渊区内 − π a < q ≤ π a -\frac{\pi}{a}<q \le \frac{\pi}{a} − a π < q ≤ a π .
对于 ω − ( q ) \omega_{-}(q) ω − ( q ) 的一支,当 q = 0 q=0 q = 0 时,频率取极小值 ω − m i n = 0 \omega_{-}^{min}=0 ω − m i n = 0 ;而当 q q q 处于布里渊区边界, q = ± π a q=\pm \frac{\pi}{a} q = ± a π 时,频率取极大值 ω − m a x = 2 β m 1 \omega_{-}^{max}=\sqrt{\frac{2\beta}{m_1} } ω − m a x = m 1 2 β ,称为声学支.命名理由是,当 $q \to 0 $ 时, ω − ( q ) = β 2 ( m 1 + m 2 ) a q = c q \omega_{-}(q)=\sqrt{\frac{\beta}{2(m_{1}+m_{2 } )} }aq=cq ω − ( q ) = 2 ( m 1 + m 2 ) β a q = c q , α − = ( B A ) − = − m 1 ω − 2 ( q ) − 2 β 2 β ≈ 1 \alpha_{-}=\left(\frac{B}{A}\right)_{-}=-\frac{m_{1}\omega_{-}^{2}(q)-2\beta}{2\beta}\approx1 α − = ( A B ) − = − 2 β m 1 ω − 2 ( q ) − 2 β ≈ 1 ,此时波的群速等于相速, d ω − ( q ) d q = ω q = c \frac{d\omega_{-}(q)}{dq}=\frac{\omega}{q}=c d q d ω − ( q ) = q ω = c ,表现为长波长弹性波,而纵弹性波与声波是等同的.从式中还可以看到,长声学波的轻、重原子的振幅和相位相同,它表示元胞质心的运动.
对于 ω + ( q ) \omega_{+}(q) ω + ( q ) 的一支,当 q = 0 q=0 q = 0 时,频率取极大值 ω + m a x = 2 β μ \omega_{+}^{max}=\sqrt{\frac{2\beta}{\mu} } ω + m a x = μ 2 β , μ = m 2 m 1 m 2 + m 1 \mu =\frac{m_2m_1}{m_2+m_1} μ = m 2 + m 1 m 2 m 1 为约合质量;而当 q q q 处于布里渊区边界, q = ± π a q=\pm \frac{\pi}{a} q = ± a π 时,频率取极小值 ω + m i n = 2 β m 2 \omega_{+}^{min}=\sqrt{\frac{2\beta}{m_2} } ω + m i n = m 2 2 β ,称为光学支.命名理由是,当 $q \to 0 $ 时, ω + ( q ) ≈ 2 β μ \omega_{+}(q)\approx\sqrt{\frac{2\beta}{\mu} } ω + ( q ) ≈ μ 2 β , α + = ( B A ) + = − m 1 ω + 2 ( q ) − 2 β 2 β ≈ − m 1 m 2 \alpha_{+}=\left(\frac{B}{A}\right)_{+}=-\frac{m_{1}\omega_{+}^{2}(q)-2\beta}{2\beta}\approx-\frac{m_{1} }{m_{2} } α + = ( A B ) + = − 2 β m 1 ω + 2 ( q ) − 2 β ≈ − m 2 m 1 .可见,其振动频率由力常数 β \beta β 和折合质量决定,这个频率恰好位于电磁波频谱的远红外区域.从式中也可以看到,长光学波的轻、重原子反向振动,而质心不动,质心坐标 Z = m 1 A + m 2 B m 1 + m 2 = 0 Z=\frac{m_1A+m_2B}{m_1+m_2}=0 Z = m 1 + m 2 m 1 A + m 2 B = 0 .在离子晶体中,正、负离子相对运动,引起极化,将与远红外电磁场强烈地耦合.
在另一极限情况即 q → ± π a q \to \pm \frac{\pi}{a} q → ± a π 时,得 ω − ≈ 2 β m 1 \omega_{-}\approx\sqrt{\frac{2\beta}{m_{1} } } ω − ≈ m 1 2 β , α − = ( B A ) − ≈ 0 \alpha_{-}=\left(\frac{B}{A}\right)_{-}\approx0 α − = ( A B ) − ≈ 0 ,ω + ≈ 2 β m 2 \omega_{+}\approx\sqrt{\frac{2\beta}{m_{2} } } ω + ≈ m 2 2 β , α + = ( B A ) + ≈ i ∞ \alpha_{+}=\left(\frac{B}{A}\right)_{+}\approx\mathrm{i}\infty α + = ( A B ) + ≈ i ∞ .此时,声学波表示质量为 m 1 m_1 m 1 的重原子振动,而轻原子几乎固定不动,因此,振动频率仅与 m 1 m_1 m 1 有关;而光学波表示质量为 m 2 m_2 m 2 的轻原子振动,重原子几乎固定不动,频率仅与 m 2 m_2 m 2 有关.严格地说, q = ± π a q = \pm \frac{\pi}{a} q = ± a π 时,沿着相反方向传播,半波长为 a a a 的两种重原子波和两种轻原子波分别叠加形成系统的两种驻波状态,其群速为 0 0 0 .
把上面的结果与单原子链进行比较是有益的.假设 m 2 → m 1 m_2 \to m_1 m 2 → m 1 ,那么在布里渊区边界处, ω − = ω + \omega_{-}=\omega_{+} ω − = ω + ,频隙消除.此时双原子链退化为单原子链,晶格常量 a → a 2 a \to \frac{a}{2} a → 2 a ,而布里渊区扩大了一倍.双原子链等价于一个格波的带通滤波器.频率 ω > 2 β μ \omega > \sqrt{\frac{2\beta}{\mu} } ω > μ 2 β 和 2 β m 1 < ω > 2 β m 2 \sqrt{\frac{2\beta}{m_1} }< \omega > \sqrt{\frac{2\beta}{m_2} } m 1 2 β < ω > m 2 2 β 的波不能在系统中传播.
对于一个包含 N N N 个元胞的有限双原子链,同理必须采用玻恩一冯卡门边界条件来处理,即
e i q N a = 1 , q = 2 π h N a , − N 2 < h ⩽ N 2 e^{iqNa}=1, \qquad q=\frac{2\pi h}{Na} ,\qquad -\frac{N}{2}<h\leqslant\frac{N}{2}
e i q N a = 1 , q = N a 2 π h , − 2 N < h ⩽ 2 N
由此 q q q 在第一布里渊区中均匀分布,取 N N N 个值.给定一组 q q q 和 ω s ( q ) \omega_s(q) ω s ( q ) 确定一个独立的模式,其中 s s s 为格波的支指标,则对于一个包含 N N N 个元胞的双原子链,其独立的波矢数=元胞数( N N N ),则其独立模式数= 2 N 2N 2 N = 自由度数.
4. 三维晶格振动 格波量子—声子
对于三维情况的色散关系推导这里就不详述了,具体的可以看书.最后得到的结论是可解出 3 n 3n 3 n 个色散关系 ω s ( q ) , s = 1 , 2 , . . . , 3 n \omega_s(\boldsymbol{q}),s=1,2,...,3n ω s ( q ) , s = 1 , 2 , . . . , 3 n .其中有 3 3 3 支声学波(元胞质心运动的自由度),在布里渊区高对称点或连线上可以分为两支横波,一支纵波;有 3 n − 3 3n-3 3 n − 3 支光学波(元胞内原子相对运动的自由度),在布里渊区高对称点或连线上可以分为 2 ( n − 1 ) 2(n-1) 2 ( n − 1 ) 支横波, n − 1 n-1 n − 1 支纵波.并且在三维空间下频率也是倒空间的周期函数 ω s ( q ) = ω s ( q + K h ) \omega_s(\boldsymbol{q})=\omega_s(\boldsymbol{q} +\boldsymbol{K_h}) ω s ( q ) = ω s ( q + K h ) .所以同理其独立的波矢 q \boldsymbol{q} q 应限制在一个倒格子元胞范围内,通常选择限制在第一布里渊区内.
对于实际的有限晶体,同理采用玻恩-冯卡门边界条件.即 $Ae^{i[\boldsymbol{q}\cdot \boldsymbol{R_l}-\omega (\boldsymbol{q})t]}=Ae^{i[\boldsymbol{q}\cdot (\boldsymbol{R_l}+N_i \boldsymbol{a_i})-\omega (\boldsymbol{q})t]} $ , e i q ⋅ N i a i ≡ 1 e^{i \boldsymbol{q}\cdot N_i \boldsymbol{a_i} }\equiv 1 e i q ⋅ N i a i ≡ 1 ,得
q ⋅ N i a i = 2 π h i { q ⋅ N 1 a 1 = 2 π h 1 q ⋅ N 2 a 2 = 2 π h 2 q ⋅ N 3 a 3 = 2 π h 3 \boldsymbol{q}\cdot N_i\boldsymbol{a}_i=2\pi h_i \begin{cases} \boldsymbol{q}\cdot N_1\boldsymbol{a}_1 & =2\pi h_1 \\ \boldsymbol{q}\cdot N_2\boldsymbol{a}_2 & =2\pi h_2 \\ \boldsymbol{q}\cdot N_3\boldsymbol{a}_3 & =2\pi h_3 & \end{cases}
q ⋅ N i a i = 2 π h i ⎩ ⎪ ⎨ ⎪ ⎧ q ⋅ N 1 a 1 q ⋅ N 2 a 2 q ⋅ N 3 a 3 = 2 π h 1 = 2 π h 2 = 2 π h 3
其中 h i ( h 1 , h 2 , h 3 ) h_i(h_1,h_2,h_3) h i ( h 1 , h 2 , h 3 ) 为整数,可以取以下波矢来满足上式
q = h 1 N 1 b 1 + h 2 N 2 b 2 + h 3 N 3 b 3 = ∑ i h i N i b i , − N i 2 < h i ≤ N i 2 \boldsymbol{q}=\frac{h_1}{N_1}\boldsymbol{b_1}+\frac{h_2}{N_2}\boldsymbol{b_2}+\frac{h_3}{N_3}\boldsymbol{b_3}=\sum_{i}\frac{h_i}{N_i}\boldsymbol{b_i},\qquad -\frac{N_i}{2}<h_i \le \frac{N_i}{2}
q = N 1 h 1 b 1 + N 2 h 2 b 2 + N 3 h 3 b 3 = i ∑ N i h i b i , − 2 N i < h i ≤ 2 N i
h i h_i h i 可取 N i N_i N i 个值,于是波矢在动量空间取分立值且均匀分布,其波矢密度= N Ω ∗ \frac{N}{\Omega^{*} } Ω ∗ N = V ( 2 π ) 3 \frac{V}{(2\pi)^3} ( 2 π ) 3 V ,其中 V V V 为晶体体积,它是一个很大的数,所以波矢在动量空间几乎是准连续分布的.又因为一个独立的 q \boldsymbol{q} q 和 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 确定系统的一个独立的简正模,系统的独立波矢数 = N N N (元胞数),而一个 q \boldsymbol{q} q 可以对应 3 n 3n 3 n 个不同的频率,所以独立模式数 = 3 n N 3nN 3 n N (总自由度数).
由于已经知道一个独立的 q \boldsymbol{q} q 和 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 等价于简正坐标 Q q s Q_{\boldsymbol{q}s} Q q s 描述的谐振子,并且其能量本征值解其薛定谔方程得 ε q s = ( n q s + 1 2 ) ℏ ω s ( q ) \varepsilon_{\boldsymbol{q}s}=(n_{\boldsymbol{q}s}+\frac{1}{2})\hbar \omega_s(\boldsymbol{q}) ε q s = ( n q s + 2 1 ) ℏ ω s ( q ) .即能量是量子化.定义格的量子 ℏ ω s ( q ) \hbar \omega_s(\boldsymbol{q}) ℏ ω s ( q ) 为声子.由配分函数可推得一个模式的振子的平均声子占据数是
n q s ( T ) = 1 e β ℏ ω s ( q ) − 1 n_{\boldsymbol{q}s}(T)=\frac{1}{e^{\beta \hbar \omega_s(\boldsymbol{q}) } -1}
n q s ( T ) = e β ℏ ω s ( q ) − 1 1
其中 β = 1 / ( k B T ) \beta =1/(k_B T) β = 1 / ( k B T ) , k B k_B k B 是玻尔兹曼常量.可见平均声子占据数由化学势 μ = 0 \mu=0 μ = 0 的玻色分布函数给出.在这种意义上,声子是玻色子,且粒子数不守恒,它可以被激发也可以被湮灭(因为化学式 μ \mu μ 代表移动一个粒子所需的能量,对于声子来说移动粒子不需要能量).由此可以得到,在温度 T T T 平衡时, ℏ ω s ( q ) \hbar \omega_s(\boldsymbol{q}) ℏ ω s ( q ) 振子的平均热激发能量为
ε q s ( T ) = [ n q s ( T ) + 1 2 ] ℏ ω s ( q ) , s = 1 , 2 , 3... , 3 n \varepsilon_{\boldsymbol{q}s}(T)=[n_{\boldsymbol{q}s}(T)+\frac{1}{2}]\hbar \omega_s(\boldsymbol{q}),\qquad s=1,2,3...,3n
ε q s ( T ) = [ n q s ( T ) + 2 1 ] ℏ ω s ( q ) , s = 1 , 2 , 3 . . . , 3 n
则系统总的平均声子数为 n ( T ) = ∑ q , s n q s ( T ) n(T)=\sum_{\boldsymbol{q},s}n_{\boldsymbol{q}s}(T) n ( T ) = ∑ q , s n q s ( T ) ,平均热激发能为 U V ( T ) = ∑ q , s [ n q s ( T ) + 1 2 ] ℏ ω s ( q ) U^V(T)=\sum_{\boldsymbol{q},s}[n_{\boldsymbol{q}s}(T)+\frac{1}{2}]\hbar \omega_s(\boldsymbol{q}) U V ( T ) = ∑ q , s [ n q s ( T ) + 2 1 ] ℏ ω s ( q ) .
至于一个波矢为 q \boldsymbol{q} q 的声子是否像其它粒子如光子一样具有物理动量 ℏ q \hbar\boldsymbol{q} ℏ q .这点在书上有较为详细的讨论.总的来说晶体原子的全部动量来源于 q = 0 q=0 q = 0 的这一模式,其它的所有声子模式对物理动量没有贡献,但是在考虑粒子与晶体的相互作用时,周期点阵中相互作用的波的总波矢是守恒的,一个声子所起的作用仿佛它的动量是 ℏ q \hbar\boldsymbol{q} ℏ q ,通常将它称为声子的准动量.
总的来说,声子是晶格集体激发的玻色型准粒子,它具有能量 ℏ ω s ( q ) \hbar \omega_s(\boldsymbol{q}) ℏ ω s ( q ) 和准动量 ℏ q \hbar\boldsymbol{q} ℏ q .通常把横声学模和纵声学模声子分别记为 T A TA T A 和 L A LA L A 声子,而把横光学声子和纵光学声子分别记 T O TO T O 和 L O LO L O 声子.
5. 离子晶体中的长光学波
在离子晶体中,长光学模代表元胞内正、负离子的反向运动,它将伴随着晶体的极化并产生内场.这不仅影响长光学模的频率,同时与电磁波有强烈的相互作用,从而对离子晶体的电学和光学性质有重要的影响.
离子晶体长光学晶格振动,正、负离子相对位移 u + − u − \boldsymbol{u_+}-\boldsymbol{u_-} u + − u − ,导致极化强度矢量 $\boldsymbol{P}=\frac{1}{\Omega}q^{*}(\boldsymbol{u_+}-\boldsymbol{u_-}) $ ,因为极化强度矢量正比于相对位移,它将以格波的频率 ω q \omega{\boldsymbol{q} } ω q 和波矢 q \boldsymbol{q} q 在时间上和空间上周期变化,产生极化波 P = P 0 e i ( q ⋅ r − ω t ) \boldsymbol{P}=\boldsymbol{P_0}e^{i(\boldsymbol{q}\cdot \boldsymbol{r}-\omega t)} P = P 0 e i ( q ⋅ r − ω t ) .根据电动力学可得到极化产生的宏观内场 E = ω 2 c 2 P − q ( q ⋅ P ) ε 0 ( q 2 − ω 2 / c 2 ) \boldsymbol{E}=\frac{\frac{\omega ^2}{c^2} \boldsymbol{P}-\boldsymbol{q}(\boldsymbol{q}\cdot \boldsymbol{P})}{\varepsilon_0 (q^2-\omega^2/c^2)} E = ε 0 ( q 2 − ω 2 / c 2 ) c 2 ω 2 P − q ( q ⋅ P ) .在晶格振动中存在纵模和横模,它们讲产生性质截然不同的内场
对于纵振动,可得 E L = − P ε 0 \boldsymbol{E_L}=-\frac{\boldsymbol{P} }{\varepsilon_0} E L = − ε 0 P ,即纵模伴随的电场时纵向的.这是一种没有磁场伴随的无旋场,类似于静电场.该电场的存在使晶体中的离子除了受近程弹性恢复力外,还要受到与相对位移反向的长程库仑力的作用,使总的恢复力变大.必然提高纵振动模的频率 ω L \omega_L ω L .
对于横振动,可得 E T = ω 2 ε 0 ( c 2 q 2 − ω 2 ) P \boldsymbol{E_T}=\frac{\omega^2}{\varepsilon_0 (c^2q^2-\omega^2)}\boldsymbol{P} E T = ε 0 ( c 2 q 2 − ω 2 ) ω 2 P .因此横模伴随的内场是一种有磁场相伴的有旋场,即电磁场.由于有这种电磁场的存在,使外电磁波与晶格振动的横模之间发生耦合,从而改变电磁波在晶体中的传播性质.当电磁波的波矢和频率与横光学模的波矢和频率相等,即 ω = c q \omega=cq ω = c q 时,发生共振,耦合最强.在共振区以外,若 ω > c q \omega>cq ω > c q , E T \boldsymbol{E_T} E T 与位移方向相反,将增加横振动的恢复力,特别当 q ≈ 0 \boldsymbol{q}\approx 0 q ≈ 0 时, E T = − P ε 0 \boldsymbol{E_T}=-\frac{\boldsymbol{P} }{\varepsilon_0} E T = − ε 0 P 与纵场 E L \boldsymbol{E_L} E L 形式相等.若 ω < c q \omega<cq ω < c q 时, E T \boldsymbol{E_T} E T 与位移方向相同,将减小横振动的恢复力,使共振频率降低,特别当 ω < < c q \omega <<cq ω < < c q 时, E T → 0 \boldsymbol{E_T} \to 0 E T → 0 ,共振频率仅由弹性恢复力决定, ω = ω T O \omega=\omega_{TO} ω = ω T O .
至于长光学波的宏观运动方程这里就不详述了.主要是利用一个位移矢量 W = ( μ Ω ) 1 / 2 ( u + − u − ) = ρ 1 / 2 ( u + − u − ) \boldsymbol{W}=(\frac{\mu}{\Omega})^{1/2}(\boldsymbol{u_+}-\boldsymbol{u_-})=\rho^{1/2}(\boldsymbol{u_+}-\boldsymbol{u_-}) W = ( Ω μ ) 1 / 2 ( u + − u − ) = ρ 1 / 2 ( u + − u − ) 来表述动能密度与势能密度,之后利用拉格朗日密度函数,哈密顿量,正则方程得到黄昆方程
{ W ¨ = b 11 W + b 12 E P = b 21 W + b 22 E \begin{cases}\ddot{\boldsymbol{W} }=b_{11}\boldsymbol{W}+b_{12}\boldsymbol{E} \\ \boldsymbol{P}=b_{21}\boldsymbol{W}+b_{22}\boldsymbol{E} \end{cases}
{ W ¨ = b 1 1 W + b 1 2 E P = b 2 1 W + b 2 2 E
其中 b 21 = b 12 b_{21}=b_{12} b 2 1 = b 1 2 ,黄昆方程是描述离子晶体中长光学波的基本方程.
若考虑离子晶体电场的极端情况则可以得到各动力系数与可测量介电函数及 ω T O \omega_{TO} ω T O (对于无耦合横长光学模频率记为 ω 0 \omega_0 ω 0 )的关系(具体论述见书)
{ b 11 = − ω 0 2 b 21 = b 12 = [ ε ( 0 ) − ε ( ∞ ) ] 1 / 2 ε 0 1 / 2 ω 0 b 22 = [ ε ( ∞ ) − 1 ] ε 0 \left\{\begin{matrix}b_{11}=-\omega _0^2 \\b_{21}=b_{12}=[\varepsilon(0)-\varepsilon (\infty )]^{1/2}\varepsilon _0^{1/2}\omega _0 \\b_{22}=[\varepsilon (\infty )-1]\varepsilon _0 \end{matrix}\right.
⎩ ⎨ ⎧ b 1 1 = − ω 0 2 b 2 1 = b 1 2 = [ ε ( 0 ) − ε ( ∞ ) ] 1 / 2 ε 0 1 / 2 ω 0 b 2 2 = [ ε ( ∞ ) − 1 ] ε 0
其中 ε ( 0 ) \varepsilon (0) ε ( 0 ) 和 ε ( ∞ ) \varepsilon (\infty ) ε ( ∞ ) 可以由介电测量得到,而 ω 0 \omega_0 ω 0 可由晶体的红外吸收谱测量得到.
在不考虑横场耦合的情况下,系统的本征振动由黄昆方程和静电方程联合解得,具体步骤不作详述.这里仅给出结果.无耦合横波本征频率为 ω T O 2 = ω 0 2 = − b 11 \omega_{TO}^2=\omega_{0}^2=-b_{11} ω T O 2 = ω 0 2 = − b 1 1 ,纵波频率 ω L O 2 = − ( b 11 − b 12 2 ε 0 + b 22 ) = [ ε ( 0 ) ε ( ∞ ) ] ω T O 2 \omega_{LO}^{2}=-(b{11}-\frac{b_{12}^2}{\varepsilon_0 +b_{22} })=[\frac{\varepsilon(0)}{\varepsilon(\infty)}]\omega_{TO}^2 ω L O 2 = − ( b 1 1 − ε 0 + b 2 2 b 1 2 2 ) = [ ε ( ∞ ) ε ( 0 ) ] ω T O 2 ,从该式容易得到:
ω L O ω T O = [ ε ( 0 ) ε ( ∞ ) ] 1 / 2 \frac{\omega_{LO} }{\omega_{TO} }=[\frac{\varepsilon(0)}{\varepsilon(\infty)}]^{1/2}
ω T O ω L O = [ ε ( ∞ ) ε ( 0 ) ] 1 / 2
它称为LST(Lyddane-Sachs-Teller)关系.由于静电介电函数 ε ( 0 ) \varepsilon(0) ε ( 0 ) 表示晶体中所有带电粒子的响应,而高频介电函数 ε ( ∞ ) \varepsilon(\infty) ε ( ∞ ) 仅仅是电子的响应,所以一般而言 ε ( 0 ) > ε ( ∞ ) \varepsilon(0)>\varepsilon(\infty) ε ( 0 ) > ε ( ∞ ) ,因此离子晶体中的长光学波纵波频率 ω L O \omega_{LO} ω L O 总是大于无耦合长光学波横波的频率 ω T O \omega_{TO} ω T O ,这是由于离子晶体中纵振动产生的极化电场,增加了纵波的恢复力.而对于非离子晶体,晶格振动不产生位移极化, b 12 = 0 b_{12}=0 b 1 2 = 0 ,可得 ω L O = ω T O \omega_{LO}=\omega_{TO} ω L O = ω T O .
若考虑横光学模声子与电磁波的相互作用.在共振条件下,声子-光子耦合将导致全新的色散关系,完全改变了电磁波的传播特性.所谓共振是指声子和光子的频率和波矢均近似相等.这些耦合过程发生在布里渊区中心附近小波矢的情况下.耦合声子-光子场的量子称为极化激元.在考虑耦合后,则系统的振动由黄昆方程和麦克斯韦方程联合解得,具体步骤不作详述.这里仅给出结果.可得对于纵声子并不与电磁场耦合,并且可再次得到LST关系.而对于横波则可得极化激元的色散关系
ω ± 2 ( q ) = 1 2 [ ω L 0 2 + c 2 q 2 ε ( ∞ ) ± [ ω L 0 4 + c 4 q 4 ε 2 ( ∞ ) + 2 c 2 q 2 ε ( ∞ ) ( ω L 0 2 − 2 ω T 0 2 ) ] 1 / 2 ] \omega_{\pm}^{2}(q)=\frac{1}{2}\left[\omega_{\mathrm{L0} }^{2}+\frac{c^{2}q^{2} }{\varepsilon(\infty)}\pm\left[\omega_{\mathrm{L0} }^{4}+\frac{c^{4}q^{4} }{\varepsilon^{2}(\infty)}+\frac{2c^{2}q^{2} }{\varepsilon(\infty)}(\omega_{\mathrm{L0} }^{2}-2\omega_{\mathrm{T0} }^{2})\right]^{1/2}\right]
ω ± 2 ( q ) = 2 1 [ ω L 0 2 + ε ( ∞ ) c 2 q 2 ± [ ω L 0 4 + ε 2 ( ∞ ) c 4 q 4 + ε ( ∞ ) 2 c 2 q 2 ( ω L 0 2 − 2 ω T 0 2 ) ] 1 / 2 ]
下图表示极化激元的色散曲线.虚直线表示未耦合的 T O TO T O 声子、 L O LO L O 声子和光子的色散关系,实线表示极化激元的色散关系.
并且可得:
(1)极化激元色散关系分解为 ω ± ( q ) \omega_{\pm}(q) ω ± ( q ) 两支.在小波矢区域,当 q → 0 q \to 0 q → 0 时,横振动和纵振动产生的电场恢复力几乎都等于 − P / ε 0 -\boldsymbol{P}/\varepsilon_0 − P / ε 0 , ω + 2 ≈ ω L O 2 \omega_{+}^{2} \approx \omega_{LO}^2 ω + 2 ≈ ω L O 2 称为类声子;而 ω − 2 ≈ c 2 q 2 / ε ( 0 ) \omega_{-}^2 \approx c^2q^2/\varepsilon(0) ω − 2 ≈ c 2 q 2 / ε ( 0 ) ,它就是低频光子的色散关系,称为类光子.在高波矢区域,当 q c > > ω L O ε ( ∞ ) qc>>\omega_{LO}\sqrt{\varepsilon (\infty)} q c > > ω L O ε ( ∞ ) 时, ω + 2 ≈ c 2 q 2 / ε ( ∞ ) \omega_{+}^2 \approx c^2q^2/\varepsilon (\infty) ω + 2 ≈ c 2 q 2 / ε ( ∞ ) ,它就是高频光子的色散关系,称为类光子,而 ω − 2 ≈ ω T O 2 \omega_{-}^2 \approx \omega_{TO}^2 ω − 2 ≈ ω T O 2 ,因为此时横振动产生的电场 E T → 0 \boldsymbol{E_T} \to 0 E T → 0 ,振动频率近似为无耦合时的频率,称为类声子.在共振区,耦合很强,此时, T O TO T O 声子与光子都不再是独立的元激发,出现光子与声子的混合模式。
(2)光子-声子的耦合产生一个频率禁区, ω T O < ω < ω L O \omega_{TO}<\omega<\omega_{LO} ω T O < ω < ω L O 在这区域不存在极化激元模式.因此,在此频率范围内的电磁波不能在晶体中传播.书上给了一个相关的例子,即频率落在禁区中的电磁波不能在一块厚的晶体中传播,几乎全部在晶体表面反射掉.感兴趣的可以看书.
6. 非完整晶格的振动 局域模
这一节的主要目的是为了说明在理想晶体产生缺陷后会导致局域态的产生.具体的计算步骤与处理方法就不讲了.这里只讲结论.若在完整晶格链中掺入一个杂质原子,那么将会导致原有的本征振动模发生相移,它们对应的本征模都是扩展模式,并且还会形成一个被推到禁带的局域模式,它随着波矢的传播方向呈指数级衰减,即局域在杂质原子附近.由此也可得任何周期性结构的破坏均可能导致局域态的出现,也就是无序可以导致局域化.这对应着安德森(Anderson)局域化.除此之外由于粒子间的关联作用也会产生局域化,这对应着莫特(Mott)局域化.
7. 晶格比热容
晶体的比热容包括晶格比热容和电子比热容两部分.晶体热激发产生声子,晶格振动能量的变化贡献晶格比热容.对于绝缘晶体,由于电子基本束缚在离子实附近,电子没有足够的自由度参与比热容的贡献,也就是热激发不足以改变电子的能量状态,因此晶格比热容几乎就是全部晶体比热容.但是对于金属晶体,倘若价电子在点阵中是自由的,那么电子就会对金属比热容提供额外的贡献,但是在温度不太低时,电子对比热容的贡献远小于晶格的贡献,一般可略去不计,只是在极低温时,电子才对金属比热容有重要贡献.
关于详细内容与积分变量的变化这里就不详述了,也就是利用前面推导声子时的平均热能来求晶体比热容.总之晶格的定容比热容可写作对频率的积分
C V ( T ) = ∫ 0 ∞ ρ ( ω ) C ( ω ) d ω C_V(T)=\int_{0}^{\infty}\rho(\omega)C(\omega)d\omega
C V ( T ) = ∫ 0 ∞ ρ ( ω ) C ( ω ) d ω
其中 ρ ( ω ) \rho(\omega) ρ ( ω ) 定义为声子态密度,它表示单位频率间隔内的模式数,应满足总模式数等于总自由度数 ∫ 0 ∞ ρ ( ω ) d ω = 3 n N \int_{0}^{\infty}\rho(\omega)d\omega=3nN ∫ 0 ∞ ρ ( ω ) d ω = 3 n N .利用 δ \delta δ 函数的筛选性质, ρ ( ω ) \rho(\omega) ρ ( ω ) 可写为
ρ ( ω ) = V ( 2 π ) 3 ∑ s ∫ Ω ∗ d q δ [ ω − ω s ( q ) ] \rho(\omega)=\frac{V}{(2\pi)^3}\sum_{s}\int_{\Omega^{*} }d \boldsymbol{q} \delta [\omega - \omega_s(\boldsymbol{q})]
ρ ( ω ) = ( 2 π ) 3 V s ∑ ∫ Ω ∗ d q δ [ ω − ω s ( q ) ]
由于在 q \boldsymbol{q} q 空间,频率相等的所有模式处于一系列连续的曲面 S ω S_{\omega} S ω ,称为等频率面.则三维情况下的 ρ ( ω ) \rho(\omega) ρ ( ω ) 可改写为沿等频率面的 S ω S_{\omega} S ω 积分,二维情况下则沿等频率线 l ω l_{\omega} l ω ,一维情况下则对两个等频率点积分
{ ρ 3 D ( ω ) = V ( 2 π ) 3 ∑ s ∬ d S ω ∣ ∇ q ω s ( q ) ∣ , 三 维 情 况 ρ 2 D ( ω ) = S ( 2 π ) 2 ∑ s ∫ d l ω ∣ ∇ q ω s ( q ) ∣ , 二 维 情 况 ρ 1 D ( ω ) = L ( 2 π ) ∑ s 2 ∣ d ω s ( q ) / d q ∣ , 一 维 情 况 \left\{\begin{matrix}\rho_{3D}(\omega)=\frac{V}{(2\pi)^3}\sum_{s}\iint \frac{dS_{\omega} }{|\nabla_{\boldsymbol{q} } \omega_s(\boldsymbol{q})|},三维情况 \\ \\ \rho_{2D}(\omega)=\frac{S}{(2\pi)^2}\sum_{s}\int \frac{dl_{\omega} }{|\nabla_{\boldsymbol{q} } \omega_s(\boldsymbol{q})|},二维情况 \\ \\ \rho_{1D}(\omega)=\frac{L}{(2\pi)}\sum_{s}\frac{2}{|d\omega_s(q)/dq|},一维情况 \end{matrix}\right.
⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ ρ 3 D ( ω ) = ( 2 π ) 3 V ∑ s ∬ ∣ ∇ q ω s ( q ) ∣ d S ω , 三 维 情 况 ρ 2 D ( ω ) = ( 2 π ) 2 S ∑ s ∫ ∣ ∇ q ω s ( q ) ∣ d l ω , 二 维 情 况 ρ 1 D ( ω ) = ( 2 π ) L ∑ s ∣ d ω s ( q ) / d q ∣ 2 , 一 维 情 况
声子态密度反映了晶格热激发的主要特性,因此它也决定了晶体中与晶格振动相关的物理过程以及宏观物理性质.在以上常用公式中,从 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 可以看到,在 q \boldsymbol{q} q 空间声子群速 v ( q ) = ∇ q ω s ( q ) = 0 \boldsymbol{v}(\boldsymbol{q})=\nabla _{\boldsymbol{q} }\omega_s(\boldsymbol{q})=0 v ( q ) = ∇ q ω s ( q ) = 0 的那些临界点附近,频谱存在局部平坦的区域,将给出 ρ ( ω ) \rho(\omega) ρ ( ω ) 的奇点,称为范霍夫(van Hove)奇点.因此在 q \boldsymbol{q} q 空间的这些临界点, q c \boldsymbol{q_c} q c 有特别重要的意义.假定 q c \boldsymbol{q_c} q c 是一个临界点.因为 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 是 q \boldsymbol{q} q 的连续函数,它可以在 q c \boldsymbol{q_c} q c 附近作泰勒展开至二次项,在主轴坐标系写为
ω s ( q ) = ω c + α 1 ξ 1 2 + α 2 ξ 2 2 + α 3 ξ 3 3 \omega_s(\boldsymbol{q})=\omega_{c}+\alpha_1 \xi_1^2+\alpha_2 \xi_2^2+\alpha_3 \xi_3^3
ω s ( q ) = ω c + α 1 ξ 1 2 + α 2 ξ 2 2 + α 3 ξ 3 3
其中 ξ = q − q c \xi =\boldsymbol{q}-\boldsymbol{q_c} ξ = q − q c 是离开临界点的矢量距离, ξ 1 \xi_1 ξ 1 , ξ 2 \xi_2 ξ 2 , ξ 3 \xi_3 ξ 3 分别是在局部主轴坐标系中 ξ \xi ξ 的分量,系数 α 1 \alpha_1 α 1 , α 2 \alpha_2 α 2 , α 3 \alpha_3 α 3 是临界点附近 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 对 q \boldsymbol{q} q 的二阶导数.因为一阶导数 v ( q ) = 0 \boldsymbol{v}(\boldsymbol{q})=0 v ( q ) = 0 ,所以展开式中线性项为0.可见存在四种不同类型的临界点
(1)当 α 1 \alpha_1 α 1 , α 2 \alpha_2 α 2 , α 3 \alpha_3 α 3 皆小于0时, q c \boldsymbol{q_c} q c 近似对应 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 的局部极大点.
(2)当 α 1 \alpha_1 α 1 , α 2 \alpha_2 α 2 , α 3 \alpha_3 α 3 皆大于0时, q c \boldsymbol{q_c} q c 近似对应 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 的局部极小点.
(3)当 α 1 \alpha_1 α 1 , α 2 \alpha_2 α 2 , α 3 \alpha_3 α 3 中一个为正,其它两个为负时, q c \boldsymbol{q_c} q c 近似对应 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 的第一类鞍点.
(4)当 α 1 \alpha_1 α 1 , α 2 \alpha_2 α 2 , α 3 \alpha_3 α 3 中两个为正,一个为负时, q c \boldsymbol{q_c} q c 近似对应 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 的第二类鞍点.
因此晶格比热容的求得归结为声子态密度的计算,它要求严格求解晶格动力学方程,正确的 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) .下面可以用两个极为简化的模型得到晶格比热容的公式.即爱因斯坦模型与德拜模型.
首先是爱因斯坦模型.爱因斯坦给出了一个最简单的晶格振动模型,假定晶体中 n N nN n N 个原子以同一确定频率振动.实际上是把晶体中的各种振动模式简化为单一的长光学波模,由于长光学波模的振动频率几乎不依赖波矢,因此有
ω s ( q ) = ω E \omega_s(\boldsymbol{q}) = \omega_E
ω s ( q ) = ω E
其中 ω E \omega_E ω E 称为爱因斯坦频率,并由此可得到爱因斯坦声子态密度:
ρ E ( ω ) = V ( 2 π ) 3 ∑ s ∫ Ω ∗ d q δ ( ω − ω E ) = 3 n N δ ( ω − ω E ) \rho_E(\omega)=\frac{V}{(2\pi)^3}\sum_{s}\int_{\Omega^{*} }d \boldsymbol{q}\delta (\omega-\omega_E)=3nN\delta(\omega -\omega_E)
ρ E ( ω ) = ( 2 π ) 3 V s ∑ ∫ Ω ∗ d q δ ( ω − ω E ) = 3 n N δ ( ω − ω E )
由此可得到爱因斯坦比热容
C ν E ( T ) = ∫ 0 ∞ C ( ω ) 3 n N δ ( ω − ω E ) d ω = 3 n N k B [ ℏ ω E / ( k B T ) ] 2 e ℏ ω E / ( k B T ) [ e ℏ ω E / ( k B T ) − 1 ] 2 C_{\nu}^{\mathrm{E} }(T)=\int_{0}^{\infty}C(\omega)3nN\delta(\omega-\omega_{\mathrm{E} })\mathrm{d}\omega=3nNk_{\mathrm{B} } \frac{\left[\hbar\omega_{\mathrm{E} }/(k_{\mathrm{B} }T)\right]^{2}\mathrm{e}^{\hbar\omega_{\mathrm{E } }/(k_{\mathrm{B} }T)} }{\left[\mathrm{e}^{\hbar\omega_{\mathrm{E} }/(k_{\mathrm{B} }T)}-1\right]^{2} }
C ν E ( T ) = ∫ 0 ∞ C ( ω ) 3 n N δ ( ω − ω E ) d ω = 3 n N k B [ e ℏ ω E / ( k B T ) − 1 ] 2 [ ℏ ω E / ( k B T ) ] 2 e ℏ ω E / ( k B T )
爱因斯坦模型本身不能确定的 ω E \omega_E ω E ,必须将理论值 C V E ( T ) C_V^E(T) C V E ( T ) 与实验测定值比较,选择最恰当的的 ω E \omega_E ω E 使之在全温区与实验值尽可能符合.定义 T E = ℏ ω E / k B T_E=\hbar \omega_E /k_B T E = ℏ ω E / k B 为爱因斯坦温度.由上式可以给出高温和低温极限下的爱因斯坦比热容,当 T > > T E T>>T_E T > > T E 时,
C V E ≈ 3 n N k B C_V^E \approx 3nNk_B
C V E ≈ 3 n N k B
它与经典的杜隆-咱蒂比热容一致。当 T < < T E T<<T_E T < < T E 时,
C V E ≈ 3 n N k B ( ℏ ω E k B T ) 2 e − ℏ ω E / ( k B T ) C_{V}^{\mathrm{E} } \approx 3nNk_{\mathrm{B} }\biggl(\frac{\hbar\omega_{\mathrm{E} } }{k_{\mathrm{B} }T}\biggr) ^{2}\mathrm{e}^{-\hbar\omega_{\mathrm{E} }/( k_{\mathrm{B} }T)}
C V E ≈ 3 n N k B ( k B T ℏ ω E ) 2 e − ℏ ω E / ( k B T )
可见当 T → 0 T \to 0 T → 0 时, C V E C_V^E C V E 按指数形式趋于0,因此爱因斯坦比热容的量子理论克服了经典理论的困难.但是实验结果是 C V ( T ) ∝ T 3 C_V(T)\propto T^3 C V ( T ) ∝ T 3 ,说明理论的粗糙,原因在于爱因斯坦模型中所有的可激发模式都集中在 ω E \omega_E ω E 处,缺少低能量的激发模式.
而德拜模型则是将晶体作为连续介质处理,也就是考虑晶体中的长波长声学模.色散关系可写为
ω s ( q ) = c s q \omega_s(\boldsymbol{q})=c_s q
ω s ( q ) = c s q
其中 c s = c 1 , c t c_s=c_1,c_t c s = c 1 , c t 分别对应长波长的纵波和横波波速.因为理想的连续介质是一个无穷自由度的体系,且对波数 q \boldsymbol{q} q 无限制,当计算系统的能量时,它将是发散的.因此,必须强加一最大波矢 q D q_D q D ,称为德拜波矢。 q D q_D q D 由下面关系确定:
4 π 3 q D 3 = Ω ∗ \frac{4\pi}{3}q_D^3 =\Omega^{*}
3 4 π q D 3 = Ω ∗
其中 Ω ∗ \Omega^{*} Ω ∗ 为晶体倒格子元胞体积,若用一个德拜球来近似布里渊区则可以得到
q D = ( 6 π 2 N V ) 1 / 3 q_D=(\frac{6\pi^2N}{V})^{1/3}
q D = ( V 6 π 2 N ) 1 / 3
其中 N N N 为系统元胞数, V V V 为晶体的体积,定义平均声速 3 c ‾ 3 = 1 c 1 ‾ 3 + 2 c t ‾ 3 \frac{3}{\overline{c}^3}=\frac{1}{\overline{c_1}^3}+\frac{2}{\overline{c_t}^3} c 3 3 = c 1 3 1 + c t 3 2 ,可以得到德拜截止频率:
ω D = c ‾ q D = ( 6 π 2 N V ) 1 / 3 c ‾ \omega_D=\overline{c}q_D=(\frac{6\pi^2N}{V})^{1/3}\overline{c}
ω D = c q D = ( V 6 π 2 N ) 1 / 3 c
常常对正点阵也作类似的近似,用一个半径为 r s r_s r s 的维格纳-塞茨球来代替实际的维格纳-塞茨胞,它们具有相同的体积: 4 3 π r s 3 = Ω \frac{4}{3}\pi r_s^3=\Omega 3 4 π r s 3 = Ω .因此
q D = ( 9 π 2 ) 1 / 3 1 r s , λ D = 2 π q D ≈ 2.6 r s q_D=(\frac{9\pi}{2})^{1/3}\frac{1}{r_s},\qquad \lambda_D=\frac{2\pi}{q_D}\approx 2.6r_s
q D = ( 2 9 π ) 1 / 3 r s 1 , λ D = q D 2 π ≈ 2 . 6 r s
换言之,声学模的截止波长稍微大于元胞的平均半径.点阵将不允许传播波长较短的波.
于是由上面的假定可以得到德拜声子态密度
ρ D ( ω ) = V ( 2 π ) 3 ∑ s ∫ d S ω ∣ ∇ q ω s ( q ) ∣ = { 9 N ω 2 ω D 3 , 0 ⩽ ω ⩽ ω D 0 , ω > ω D \rho_{D}(\omega)=\frac{V}{\left(2\pi\right)^{3} }\sum_{s}\int\frac{\mathrm{d}S_{\omega} }{\mid\nabla_{q}\omega_{s}(\boldsymbol{q})\mid}= \begin{cases} \frac{9N\omega^{2} }{\omega_{\mathrm{D} }^{3} }, & 0\leqslant\omega\leqslant\omega_{\mathrm{D} } \\ \\ 0, & \omega>\omega_{\mathrm{D} } & \end{cases}
ρ D ( ω ) = ( 2 π ) 3 V s ∑ ∫ ∣ ∇ q ω s ( q ) ∣ d S ω = ⎩ ⎪ ⎨ ⎪ ⎧ ω D 3 9 N ω 2 , 0 , 0 ⩽ ω ⩽ ω D ω > ω D
于是可得到德拜比热容公式:
C V D = ∫ 0 ∞ ρ D ( ω ) C ( ω ) d ω = ∫ 0 ω D 9 N ω 2 ω D 3 ⋅ k B ( ℏ ω k B T ) 2 e ℏ ω / ( k B T ) [ e ℏ ω / ( k B T ) − 1 ] 2 d ω C_{V}^{\mathrm{D} }=\int_{0}^{\infty}\rho_{\mathrm{D} }(\omega)C(\omega)\mathrm{d}\omega=\int_{0}^{\omega_{\mathrm{D} } }\frac{9N\omega^{2} }{\omega_{\mathrm{D} }^{3} }\cdot k_{\mathrm{B} }\frac{\left(\frac{\hbar\omega}{k_{\mathrm{B} }T}\right)^{2}\mathrm{e}^{\hbar\omega/(k_{\mathrm{B} }T)} }{\left[\mathrm{e}^{\hbar\omega/(k_{\mathrm{B} }T)}-1\right]^{2} }\mathrm{d}\omega
C V D = ∫ 0 ∞ ρ D ( ω ) C ( ω ) d ω = ∫ 0 ω D ω D 3 9 N ω 2 ⋅ k B [ e ℏ ω / ( k B T ) − 1 ] 2 ( k B T ℏ ω ) 2 e ℏ ω / ( k B T ) d ω
令 ξ = ℏ ω / ( k B T ) \xi =\hbar \omega /(k_BT) ξ = ℏ ω / ( k B T ) ,并定义德拜温度 θ D = ℏ ω D / k B \theta_D=\hbar \omega_D/k_B θ D = ℏ ω D / k B ,得到
C V D = 9 N k B ( T θ D ) 3 ∫ 0 θ D T ξ 4 e ξ ( e ξ − 1 ) 2 d ξ = 3 N k B f ( θ D T ) C_{V}^{\mathrm{D} } = 9Nk_{\mathrm{B} }\biggl(\frac{T}{\theta_{\mathrm{D} } }\biggr) ^{3} \int_{0}^{\frac{\theta_{\mathrm{D} } }{T} } \frac{\xi^{4}\mathrm{e}^{\xi} }{\left( \mathrm{e}^{\xi} - 1 \right)^{2} } \mathrm{d}\xi = 3Nk_{\mathrm{B} }f\biggl(\frac{\theta_{\mathrm{D} } }{T}\biggr)
C V D = 9 N k B ( θ D T ) 3 ∫ 0 T θ D ( e ξ − 1 ) 2 ξ 4 e ξ d ξ = 3 N k B f ( T θ D )
其中
f ( θ D T ) = 3 ( T θ D ) 3 ∫ 0 θ D T ξ 4 e ξ ( e ξ − 1 ) 2 d ξ f\left(\frac{\theta_\mathrm{D} }{T}\right)=3\left(\frac{T}{\theta_\mathrm{D} }\right)^3\int_0^{\frac{\theta_\mathrm{D} }{T} }\frac{\xi^4\mathrm{e}^\xi}{\left(\mathrm{e}^\xi-1\right)^2}\mathrm{d}\xi
f ( T θ D ) = 3 ( θ D T ) 3 ∫ 0 T θ D ( e ξ − 1 ) 2 ξ 4 e ξ d ξ
称为德拜比热容函数.在德拜理论中,特征温度还是待定常量.它可以通过(1)从固体的弹性模量求弹性波速 c s c_s c s ,由此得到平均声速 c ‾ \overline{c} c ,再从 θ D = ℏ k B ω D = ℏ k B c ‾ ( 6 π 2 N V ) 1 / 3 \theta_{\mathrm{D} }=\frac{\hbar}{k_{\mathrm{B} } }\omega_{\mathrm{D} }=\frac{\hbar}{k_{\mathrm{B} } }\overline{c}\left(\frac{6\pi^{2}N}{V}\right)^{1/3} θ D = k B ℏ ω D = k B ℏ c ( V 6 π 2 N ) 1 / 3 得到德拜温度.(2)选择恰当的 θ D \theta_D θ D 使之可以拟合出在全温区与实验数据尽可能相符的曲线.
由德拜比热容公式可以得到在高温和低温极限下的比热容.在高温下, T > > θ D T>>\theta_D T > > θ D ,和爱因斯坦模型一样与经典比热容一致为
C V D ≈ 3 N k B C_V^D \approx 3Nk_B
C V D ≈ 3 N k B
在低温下, T < < θ D T<<\theta_D T < < θ D ,德拜比热容为
C V D ≈ 12 5 π 4 N k B ( T θ D ) 3 C_{V}^{\mathrm{D} }\approx\frac{12}{5}\pi^{4}Nk_{\mathrm{B} }\left(\frac{T}{\theta_{\mathrm{D} } }\right)^{3}
C V D ≈ 5 1 2 π 4 N k B ( θ D T ) 3
它与温度的3次方成比例.可见,德拜比热容在高温区和低温区都得到了正确的温度关系.这是因为系统总的热能
U V ( T ) = ( 被 激 发 的 模 式 数 ) ⋅ ( 每 个 模 式 激 发 的 声 子 数 ) ⋅ ( 每 个 声 子 的 能 量 ) U^V(T) = (被激发的模式数)\cdot(每个模式激发的声子数)\cdot(每个声子的能量)
U V ( T ) = ( 被 激 发 的 模 式 数 ) ⋅ ( 每 个 模 式 激 发 的 声 子 数 ) ⋅ ( 每 个 声 子 的 能 量 )
当 T > > θ D T>>\theta_D T > > θ D 时,所有模式都被激发,与温度无关.而每一模式的声子数正比于温度 T T T .因此,总的热能正比于温度 T T T ,比热容与温度无关.当 T < < θ D T<<\theta_D T < < θ D 时,只有 ℏ ω < k B T \hbar \omega<k_BT ℏ ω < k B T 的模式被激发,也就是在 q \boldsymbol{q} q 空间, 4 π 3 q 3 ≤ 4 π 3 ( 1 c ‾ k B T ℏ ) 3 \frac{4\pi}{3}q^3 \le \frac{4\pi}{3}(\frac{1}{\overline{c} }\frac{k_BT}{\hbar})^3 3 4 π q 3 ≤ 3 4 π ( c 1 ℏ k B T ) 3 ,球体内的模式被激发,因此,被激发的模式数~ T 3 T^3 T 3 ,每个模式的声子能量~ T T T ,总的热能~ T 4 T^4 T 4 ,比热容与温度 T 3 T^3 T 3 成比例.
但德拜模型也并非是精确的,因为德拜温度 θ D = ℏ ω D / k B \theta_D=\hbar \omega_D/k_B θ D = ℏ ω D / k B 并不是常量,并且其色散关系与声子态密度与实际情况也十分粗糙.书上以一维晶格模型举例说明了德拜模型的粗糙度,感兴趣的可以看书.
8. 晶格状态方程和热膨胀
对于过程的推导这里照样略过,直接给出系统的自由能为:
F ( T , V ) = F 0 ( V ) + F V ( T , V ) F(T,V)=F^0(V)+F^V(T,V)
F ( T , V ) = F 0 ( V ) + F V ( T , V )
F V ( T , V ) = k B T ∑ q s ln [ 1 − e − ℏ ω s ( q ) k B T ] = k B T ∫ 0 ∞ ρ ( ω ) ln ( 1 − e − ℏ ω k B T ) d ω F^{V}(T,V)=k_{\mathrm{B} }T\sum_{qs}\ln[1-\mathrm{e}^{-\frac{\hbar\omega_{s}(q)}{k_{B}T} }]=k_{\mathrm{B } }T\int_{0}^{\infty}\rho(\omega)\ln(1-\mathrm{e}^{-\frac{\hbar\omega}{k_{B}T} })\mathrm{d}\omega
F V ( T , V ) = k B T q s ∑ ln [ 1 − e − k B T ℏ ω s ( q ) ] = k B T ∫ 0 ∞ ρ ( ω ) ln ( 1 − e − k B T ℏ ω ) d ω
根据热力学关系,可以得到系统的状态方程
p = − [ ∂ F ( T , V ) ∂ V ] r = − d U 0 ( V ) d V − ∑ q s ℏ e − h ω s ( q ) h B T 1 − e − h ω s ( q ) h B T d ω s ( q ) d V = − d U 0 ( V ) d V − ∑ q s ℏ ω s ( q ) e h ω s ( q ) h B T − 1 1 V d ln ω s ( q ) d ln V \begin{aligned} \mathrm{p} & =-\left[\frac{\partial F(T,V)}{\partial V}\right]_{r}=-\frac{\mathrm{d}U^{0}(V)}{\mathrm{d}V}-\sum_{\boldsymbol{q}s}\frac{\hbar\mathrm{e}^{-\frac{h\omega_{s}(\boldsymbol{q})}{h_{\mathrm{B} }T} } }{1-\mathrm{e}^{-\frac{h\omega_{s}(\boldsymbol{q})}{h_{\mathrm{B} }T} } }\frac{\mathrm{d}\omega_{s}(\boldsymbol{q})}{\mathrm{d}V} \\ & =-\frac{\mathrm{d}U^{0}(V)}{\mathrm{d}V}-\sum_{\boldsymbol{q}s}\frac{\hbar\omega_{s}(\boldsymbol{q})}{\mathrm{e}^{\frac{h\omega_{s}(\boldsymbol{q})}{h_{\mathrm{B } }T} }-1}\frac{1}{V}\frac{\mathrm{d}\ln\omega_{s}(\boldsymbol{q})}{\mathrm{d}\ln V} \end{aligned}
p = − [ ∂ V ∂ F ( T , V ) ] r = − d V d U 0 ( V ) − q s ∑ 1 − e − h B T h ω s ( q ) ℏ e − h B T h ω s ( q ) d V d ω s ( q ) = − d V d U 0 ( V ) − q s ∑ e h B T h ω s ( q ) − 1 ℏ ω s ( q ) V 1 d ln V d ln ω s ( q )
但是各振动频率 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 对 V V V 的依赖关系很复杂,因此格林艾森(E.Gruneisen)假定,对于所有振动模式它近似相同,并为一常数:
γ = − d l n ω s ( q ) d l n V \gamma=-\frac{dln \omega_s(\boldsymbol{q})}{dln V}
γ = − d l n V d l n ω s ( q )
称为格林艾森常数.因为当晶体体积增大时,原子间相互作用减弱,所以 ω s ( q ) \omega_s(\boldsymbol{q}) ω s ( q ) 随着 V V V 的增加而减小, γ > 0 \gamma >0 γ > 0 .在这种假设下,则有:
p = − d U 0 ( V ) d V + γ U V ( T , V ) V = p 内 + p 热 p=-\frac{\mathrm{d}U^{0}(V)}{\mathrm{d}V}+\gamma\frac{U^{V}(T,V)}{V}=p_{_\text{内} }+p_{_\text{热} }
p = − d V d U 0 ( V ) + γ V U V ( T , V ) = p 内 + p 热
称为格林艾森方程.通常把称 p 内 = − d U 0 ( V ) d V p_{_\text{内} }=-\frac{\mathrm{d}U^{0}(V)}{\mathrm{d}V} p 内 = − d V d U 0 ( V ) 为内压强,它与温度无关,起因于原子之间的相互作用,取决于内聚能与体积的关系.而把 p 热 = γ U V ( T , V ) V p_{_\text{热} }=\gamma\frac{U^{V}(T,V)}{V} p 热 = γ V U V ( T , V ) 称为热压强,它与晶格振动有关,是温度和体积的函数.
格林艾森方程可以直接用来讨论晶体的热膨胀.详细讨论见书.另由格林艾森方程可以得到关系
1 V γ C ν = − ( ∂ p ∂ V ) r ( ∂ V ∂ T ) p = − V ( ∂ p ∂ V ) r 1 V ( ∂ V ∂ T ) p = B α \frac{1}{V}\gamma C_{\nu}=-\left(\frac{\partial p}{\partial V}\right)_{r}\left(\frac{\partial V}{\partial T}\right)_{p}=-V\left(\frac{\partial p}{\partial V}\right)_{r}\frac{1}{V}\left(\frac{\partial V}{\partial T}\right)_{p}=B\alpha
V 1 γ C ν = − ( ∂ V ∂ p ) r ( ∂ T ∂ V ) p = − V ( ∂ V ∂ p ) r V 1 ( ∂ T ∂ V ) p = B α
其中 B = − V ( ∂ p ∂ V ) T B=-V\left(\frac{\partial p}{\partial V}\right)_{T} B = − V ( ∂ V ∂ p ) T 为晶体的体弹模量, α = 1 V ( ∂ V ∂ T ) p \alpha=\frac{1}{V}\left(\frac{\partial V}{\partial T}\right)_{_p} α = V 1 ( ∂ T ∂ V ) p 为热膨胀系数.该式称为热膨胀的格林艾森关系.它给出了 γ \gamma γ 与可测物理量 B B B , α \alpha α , C V C_V C V 之间的关系,测出这些物理量就可以确定格林艾森常数 γ \gamma γ .另外书上讨论了热膨胀与非谐效应的关系,详细讨论见书.
第四章 能带论
1. 布洛赫(Bloch)定理和布洛赫波
对于自由电子,哈密顿算符 H ^ = − ℏ 2 2 m ∇ 2 \hat{H}=-\frac{\hbar^2}{2m}\nabla^2 H ^ = − 2 m ℏ 2 ∇ 2 和动量算符 p ^ = ℏ i ∇ \hat{p}=\frac{\hbar}{i}\nabla p ^ = i ℏ ∇ 是对易的,即 [ H ^ , p ^ ] = 0 [\hat{H},\hat{p}]=0 [ H ^ , p ^ ] = 0 .本征态具有确定的能量 E = ℏ 2 k 2 2 m E=\frac{\hbar^2 k^2}{2m} E = 2 m ℏ 2 k 2 和动量 p = ℏ k \boldsymbol{p}=\hbar \boldsymbol{k} p = ℏ k ,共同的本征函数 ψ k ( r ) = 1 V e i k ⋅ r \psi_k(\boldsymbol{r})=\frac{1}{\sqrt{V} }e^{i\boldsymbol{k} \cdot\boldsymbol{r} } ψ k ( r ) = V 1 e i k ⋅ r 可以用 k \boldsymbol{k} k 来标志.但是对于周期场中运动的电子,哈密顿算符与动量算符不可对易, [ H ^ , p ^ ] ≠ 0 [\hat{H},\hat{p}]\ne 0 [ H ^ , p ^ ] = 0 .显然不能用 p ^ \hat{p} p ^ 对应的量子数 k \boldsymbol{k} k 去标志电子的状态.实际上此时电子的动量不确定.而此时应用平移算符与哈密顿算符的本征值进行标定.
至于平移算符的本征值问题的推导这里就不写了.直接给出其本征值 λ ( a i ) \lambda(\boldsymbol{a_i}) λ ( a i ) 的表达形式
λ ( a i ) = e i k ⋅ a i ⇒ { e i k ⋅ a 1 = λ ( a 1 ) e i k ⋅ a 2 = λ ( a 2 ) e i k ⋅ a 3 = λ ( a 3 ) \lambda\left(\boldsymbol{a}_{i}\right)=\mathrm{e}^{\mathrm{i}\boldsymbol{k}\cdot\boldsymbol{a}_{i} }\Rightarrow \begin{cases} \mathrm{e}^{\mathrm{i}\boldsymbol{k}\cdot\boldsymbol{a}_{1} }=\lambda\left(\boldsymbol{a}_{1}\right) \\ \\ \mathrm{e}^{\mathrm{i}\boldsymbol{k}\cdot\boldsymbol{a}_{2} }=\lambda\left(\boldsymbol{a}_{2}\right) \\ \\ \mathrm{e}^{\mathrm{i}\boldsymbol{k}\cdot\boldsymbol{a}_{3} }=\lambda\left(\boldsymbol{a}_{3}\right) & \end{cases}
λ ( a i ) = e i k ⋅ a i ⇒ ⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ e i k ⋅ a 1 = λ ( a 1 ) e i k ⋅ a 2 = λ ( a 2 ) e i k ⋅ a 3 = λ ( a 3 )
其中矢量 k \boldsymbol{k} k 是平移算符本征值对应的量子数.因为它并不是动量算符对应的量子数, ℏ k \hbar \boldsymbol{k} ℏ k 也不是粒子的真实动量,常常称为粒子在晶体中得到准动量.
又由玻恩-冯卡门边界条件可得 λ N i ( a i ) = e i N i k ⋅ a i ≡ 1 \lambda^{N_i}(\boldsymbol{a_i})=e^{iN_i \boldsymbol{k} \cdot \boldsymbol{a_i} } \equiv 1 λ N i ( a i ) = e i N i k ⋅ a i ≡ 1 ,则量子数 k \boldsymbol{k} k 必须满足
{ N 1 k ⋅ a 1 = 2 π h 1 N 2 k ⋅ a 2 = 2 π h 2 N 3 k ⋅ a 3 = 2 π h 3 \left\{\begin{matrix}N_1 \boldsymbol{k} \cdot \boldsymbol{a_1}=2\pi h_1 \\ N_2\boldsymbol{k} \cdot \boldsymbol{a_2}=2\pi h_2 \\N_3\boldsymbol{k} \cdot \boldsymbol{a_3}=2\pi h_3 \end{matrix}\right.
⎩ ⎨ ⎧ N 1 k ⋅ a 1 = 2 π h 1 N 2 k ⋅ a 2 = 2 π h 2 N 3 k ⋅ a 3 = 2 π h 3
其中 h 1 h_1 h 1 , h 2 h_2 h 2 , h 3 h_3 h 3 为整数.显然将 k \boldsymbol{k} k 写成
k = h 1 N 1 b 1 + h 2 N 2 b 2 + h 3 N 3 b 3 \boldsymbol{k}=\frac{h_1}{N_1}\boldsymbol{b_1}+\frac{h_2}{N_2}\boldsymbol{b_2}+\frac{h_3}{N_3}\boldsymbol{b_3}
k = N 1 h 1 b 1 + N 2 h 2 b 2 + N 3 h 3 b 3
也将满足上述条件,其中 b 1 \boldsymbol{b_1} b 1 , b 2 \boldsymbol{b_2} b 2 , b 3 \boldsymbol{b_3} b 3 为倒格矢.
于是周期场中单电子的波函数可以写为 ψ k n ( r ) \psi_{\boldsymbol{k} }^n(\boldsymbol{r}) ψ k n ( r ) ,它用量子数 n n n 和 k \boldsymbol{k} k 来标志.并且满足:
布洛赫定理:当平移晶格矢量 R l \boldsymbol{R_l} R l 时,同一能量本征值的波函数只增加相位因子 e i k ⋅ R l e^{i\boldsymbol{k}\cdot \boldsymbol{R_l} } e i k ⋅ R l .
于是根据布洛赫定理,周期场中单电子波函数应该是一个调幅平面波:
ψ k n ( r ) = e i k ⋅ r u k n ( r ) \psi_{\boldsymbol{k} }^n(\boldsymbol{r})=e^{i\boldsymbol{k}\cdot \boldsymbol{r} }u_{\boldsymbol{k} }^n(\boldsymbol{r})
ψ k n ( r ) = e i k ⋅ r u k n ( r )
其中调幅因子 u k n ( r + R l ) = u k n ( r ) u_{\boldsymbol{k} }^n(\boldsymbol{r+R_l})=u_{\boldsymbol{k} }^n(\boldsymbol{r}) u k n ( r + R l ) = u k n ( r ) 为正点阵的周期函数(于是可以用倒格矢进行展开).它正好满足布洛赫定理.于是与自由电子相比,晶体周期场的作用只是用一个调幅平面波取代了平面波,称为布洛赫波,它是一个无衰减的在晶体中传播的波,不会受到晶格势场的散射(如布洛赫振荡).
然后是关于布洛赫波能谱的一些特征,具体不证明,仅给出结论.
(1)对于一个确定的 k \boldsymbol{k} k 有无穷多个分立的能量本征值 E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 和相应的本征函数时 ψ k n ( r ) \psi_{\boldsymbol{k} }^n(\boldsymbol{r}) ψ k n ( r ) , n = 1 , 2... , ∞ n=1,2...,\infty n = 1 , 2 . . . , ∞ .
(2)对于一个确定的 n n n , E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 是 k \boldsymbol{k} k 在倒空间的周期函数, E n ( k ) = E n ( k + K h ) E_n(\boldsymbol{k})=E_n(\boldsymbol{k+K_h}) E n ( k ) = E n ( k + K h ) , ψ k n ( r ) = ψ k + K h n ( r ) \psi_{\boldsymbol{k} }^n(\boldsymbol{r})=\psi_{\boldsymbol{k+K_h} }^n(\boldsymbol{r}) ψ k n ( r ) = ψ k + K h n ( r ) , 其中 K h = ∑ i h i b i \boldsymbol{K_h}=\sum_{i}h_i\boldsymbol{b_i} K h = ∑ i h i b i 为倒格矢.
(3)能谱成带结构.既然对于一个确定的 n n n , E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 是 k \boldsymbol{k} k 在倒空间的周期函数,那必然有能量的上下界,使得一个 n n n 不同的 k \boldsymbol{k} k 的所有能级包括在一个能量范围内.因此会形成一个准连续的能带.
(4)能谱的对称性.若不考虑自旋-轨道相互作用,在布里渊区中晶体能谱具有晶体点阵相同的宏观对称性.即 E n ( k ) = E n ( − k ) E^n({\boldsymbol{k} })=E^n({-\boldsymbol{k} }) E n ( k ) = E n ( − k ) .
(5)等能面垂直于布里渊区界面.
从第二节一直到第六节都是一些能带的计算方法,具体步骤不会细写,这里只写大致的处理方法和思想.此外之后可能会单出一篇来总结一下常见的计算方法,因为这本书所描述的近似方法并不全面,如增广平面波法(APM),格林函数法(KKR),密度泛函理论(DFT)等是没有记录的.不过密度泛函理论在我以前的博客里有稍微写过.
2. 平面波法(PW)
平面波法是根据布洛赫定理所得的周期势场中单电子波函数是一个调幅平面波 ψ k n ( r ) = u k n ( r ) e i k ⋅ r \psi_{\boldsymbol{k} }^n(\boldsymbol{r})=u_{\boldsymbol{k} }^n(\boldsymbol{r})e^{i\boldsymbol{k}\cdot \boldsymbol{r} } ψ k n ( r ) = u k n ( r ) e i k ⋅ r ,前面在倒格矢那一章曾讲过正点阵的周期函数可以用倒格矢进行傅里叶展开.因此平面波法就是将单电子波函数用倒格矢进行展开.
∣ ψ k ⟩ = ∑ h a ( k + K h ) ∣ k + K h ⟩ \mid\psi_{\boldsymbol{k} }\rangle=\sum_{h}a(\boldsymbol{k+K_{h } } )\mid \boldsymbol{k+K_{h } }\rangle
∣ ψ k ⟩ = h ∑ a ( k + K h ) ∣ k + K h ⟩
其中 $\mid\boldsymbol{k+K_{h } }\rangle=\frac{1}{\sqrt{N\Omega} }\mathrm{e}^{\mathrm{i}(\boldsymbol{k+K_{h } })\cdot \boldsymbol{r} } $ 为一平面波.可见所得到的周期场中单电子波函数是一系列相差一个倒格矢的平面波的叠加.
至于之后的处理就是量子力学里的那一套了,无非就是代入定态薛定谔方程,然后对具有周期性的势能展开,之后作用左矢得到线性齐次方程组,这个方程组有解的条件就是系数行列式为0,于是最后可以得到确定能量本征值的方程
det ∣ [ ℏ 2 2 m ( k + K h ) 2 − E ( k ) ] δ K h , K h ′ + V ( K h − K h ′ ) ∣ = 0 \det\left|\left[\frac{\hbar^2}{2m}(\boldsymbol{k+K_h})^2-E(\boldsymbol{k})\right]\delta_{\boldsymbol{K_h},\boldsymbol{K_{h^{\prime} } } } +V(\boldsymbol{K_h}-\boldsymbol{K_{h^{\prime} } } )\right|=0
det ∣ ∣ ∣ ∣ [ 2 m ℏ 2 ( k + K h ) 2 − E ( k ) ] δ K h , K h ′ + V ( K h − K h ′ ) ∣ ∣ ∣ ∣ = 0
由于 K h \boldsymbol{K_h} K h 和 K h ′ \boldsymbol{K_{h^{\prime} } } K h ′ 遍历所有倒格矢,所以原则上该式是一个 ∞ × ∞ \infty \times \infty ∞ × ∞ 阶行列式.而实际计算时只能取有限阶行列式.例如取100个平面波叠加,得到100阶的行列式,再得到 E ( k ) E(\boldsymbol{k}) E ( k ) 的100次代数方程,原则上可解出100个能量本征值 E n ( k , n = 1 , 2 , . . . , 100 ) E_n(\boldsymbol{k},n=1,2,...,100) E n ( k , n = 1 , 2 , . . . , 1 0 0 ) .虽然平面波法是严格求解周期势场中单电子薛定谔方程的方法,但因其涉及高阶行列式的求解,尤其是势能变化激烈时,收敛性很差.所以实际运用中往往采取一些其它的近似方法.
3. 近自由电子近似
前面提到了平面波法收敛性的问题.因此若对于周期势场的空间变化微弱的情况, Δ V \Delta V Δ V 是小量,电子的行为十分接近自由电子, Δ V \Delta V Δ V 可以作为微扰处理,这就是近自由电子近似的方法.然后就是量子力学里处理微扰的那一套了,非简并微扰论简并微扰论零级近似一级近似二级近似的那些东西,并且可以注意到此时在平面波法中的无穷多方程组将仅仅保留两个方程.关于计算步骤这里就不写了.总之可以得到在 k 2 − ( k + K h ) 2 ≠ 0 \boldsymbol{k^2}-\boldsymbol{(k+K_h)^2}\ne 0 k 2 − ( k + K h ) 2 = 0 时,有
E ( k ) = ℏ 2 2 m k 2 + ∑ h ≠ 0 ∣ V ( K h ) ∣ 2 ℏ 2 2 m [ k 2 − ( k + K h ) 2 ] E(\boldsymbol{k})=\frac{\hbar^{2} }{2m}\boldsymbol{k}^{2}+\sum_{h\neq0}\frac{\mid V(\boldsymbol{K_{h} })\mid^{2} }{\frac{\hbar^{2} }{2m}[\boldsymbol{k}^{2}-(\boldsymbol{k}+\boldsymbol{K_{h} })^{2}]}
E ( k ) = 2 m ℏ 2 k 2 + h = 0 ∑ 2 m ℏ 2 [ k 2 − ( k + K h ) 2 ] ∣ V ( K h ) ∣ 2
而当 k 2 − ( k + K h ) 2 ≠ 0 \boldsymbol{k^2}-\boldsymbol{(k+K_h)^2}\ne 0 k 2 − ( k + K h ) 2 = 0 时的能量将退简并
E ± ( k ) = 1 2 [ ℏ 2 2 m [ k 2 + ( k + K h ) 2 ] ± ℏ 4 4 m 2 [ k 2 − ( k + K h ) 2 ] 2 + 4 ∣ V ( K h ) ∣ 2 ] E_{\pm}(\boldsymbol{k})=\frac{1}{2}\left[\frac{\hbar^{2} }{2m}\left[\boldsymbol{k}^{2}+\left(\boldsymbol{k}+\boldsymbol{K_{h} }\right)^{2}\right]\pm\sqrt{\frac{\hbar^{4} }{4m^{2} }\left[\boldsymbol{k}^{2}-\left(\boldsymbol{k}+\boldsymbol{K_{h} }\right)^{2}\right]^{2}+4|V(\boldsymbol{K_{h} })|^{2} }\right]
E ± ( k ) = 2 1 [ 2 m ℏ 2 [ k 2 + ( k + K h ) 2 ] ± 4 m 2 ℏ 4 [ k 2 − ( k + K h ) 2 ] 2 + 4 ∣ V ( K h ) ∣ 2 ]
E ± ( k ) = ℏ 2 2 m k 2 ± ∣ V ( K h ) ∣ E_{\pm}(\boldsymbol{k})=\frac{\hbar^2}{2m}\boldsymbol{k}^2 \pm |V(\boldsymbol{K_h})|
E ± ( k ) = 2 m ℏ 2 k 2 ± ∣ V ( K h ) ∣
于是可以看到对于 k 2 = ( k + K h ) 2 \boldsymbol{k^2}=\boldsymbol{(k+K_h)^2} k 2 = ( k + K h ) 2 的 k \boldsymbol{k} k 值,非简并微扰计算导致发散.这个条件可写为
K h ⋅ ( k + 1 2 K h ) \boldsymbol{K_h}\cdot(\boldsymbol{k}+\frac{1}{2}\boldsymbol{K_h})
K h ⋅ ( k + 2 1 K h )
满足上述方程的 k \boldsymbol{k} k 矢量的端点,在 k \boldsymbol{k} k 空间确定了一系列的平面,这些平面就是倒格矢 − K h -\boldsymbol{K_h} − K h 的垂直平分面.而所谓的布里渊区就是在 k \boldsymbol{k} k 空间,所有倒格矢 K h \boldsymbol{K_h} K h 的垂直平分面将 k \boldsymbol{k} k 空间分割成若干区域.其中包含原点的最小闭合空间称为第一布里渊区,完全包围第一布里渊区的若干小区域的全体称为第二布里渊区…依此类推.每个布里渊区的体积恰好等于倒格子元胞的体积.而第一布里渊区就是倒点阵的W-S元胞.
并且由于能量的退简并,还可以画出一维近自由电子近似的能谱.
可见自由电子得到连续抛物线能谱,在布里渊区界面 k = n π a k=\frac{n\pi}{a} k = a n π 被割断,发生能量的突变,形成宽度为 2 ∣ V ( K h ) ∣ 2|V(\boldsymbol{K_h})| 2 ∣ V ( K h ) ∣ 的能隙.从能量轴来看不存在这些能量对应的量子态,构成禁带.而对于布里渊区内的状态,能量准连续分布构成能带.
并且值得注意的是,对于一维情况,由于方向的单一性,能隙和禁带一一对应.但是对于二维和三维情况,可能出现不同 k \boldsymbol{k} k 方向能带的重叠,能隙和禁带可能不一一对应。即存在能隙时但不一定是禁带.具体例子见书.
至于能隙的成因在书上有较为详细的描述与计算.即在布里渊区边界上会形成两种驻波,并使得电子倾向于聚集在晶体中不同的空间区域.一种将电子聚集在离子实之间,其势能较高;另一种倾向于将电子聚集在离子实附近,其势能较低.这就是能隙的成因.并且两种驻波态的平均势能差恰好是期待的能隙宽度.而晶体中电子波的布拉格反射就是能隙的起因.但是当电子的波矢落在布里渊区界面,满足布拉格条件时,是否一定产生能隙,那还取决于相应的周期势的傅里叶分量是否为零(如第一章的几何结构因子).
在近自由电子近似中,以自由电子作为零级近似,并借用自由电子的波矢 k \boldsymbol{k} k 去标志周期势场中单电子状态. k \boldsymbol{k} k 是动量算符本征值 ℏ k \hbar\boldsymbol{k} ℏ k 对应的量子数,它可以遍及整个 k \boldsymbol{k} k 空间.其波函数仍然是一个调幅平面波.但近自由电子近似下的波函数和能谱并不是倒空间的周期函数,属于不同能带的状态,分布在不同的布里渊区内.于是周期势场中单电子的状态应该用简约波矢去标志.为了区别起见,用 k ‾ \overline{\boldsymbol{k } } k 表示
简约波矢, k ‾ \overline{\boldsymbol{k} } k 限制在第一布里渊区内,虽然任意一个处于第一布里渊区外的 k \boldsymbol{k} k 都可用简约波矢 k ‾ \overline{\boldsymbol{k} } k 表示为 k = k ‾ + K h \boldsymbol{k}=\overline{\boldsymbol{k} }+\boldsymbol{K_h} k = k + K h ,但由于在近自由电子近似中, k \boldsymbol{k} k 与 k ‾ \overline{\boldsymbol{k} } k 并不同态,因此,根据布洛赫定理将近自由电子近似下的能谱从第一布里渊区外平移一个倒格矢 K h \boldsymbol{K_h} K h 填入第一布里渊区时,为了区别它是由哪一个布里渊区区移入的,必须引人一个新的量子数 h h h ,称为能带序号.
而对应能带的能区图式也有三种.将不同的能带绘于 k \boldsymbol{k} k 空间中不同布里渊区内的称为扩展能区图式(extended zone scheme).将所有能带 E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 绘于第一布里渊区内的称为简约能区图式(reduced zone scheme).由 E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 的周期性在一个布里渊区中绘出所有能带的称为周期能区图式(repeated zone scheme).
4. 紧束缚近似(TBA)
在平面波法中,是将布洛赫波按平面波展开表示.另一方面,布洛赫波也可以用一组正交、完备的局域函数基展开得到.也就是利用布洛赫函数是倒点阵的周期函数,于是可以按正格矢量展开为一系列万尼尔(Wannier)函数的叠加的性质来进行能带计算.并且这组具备局域函数性质的万尼尔函数也具备正交完备性.
而紧束缚模型的思想就是将孤立原子的定域波函数 φ n ( r − R l ) \varphi_{n}(\boldsymbol{r}-\boldsymbol{R_{l} }) φ n ( r − R l ) 作为万尼尔函数 a n ( r − R l ) a_{n}(\boldsymbol{r}-\boldsymbol{R_{l} }) a n ( r − R l ) 来进行布洛赫波的展开,即
ψ k n ( r ) = 1 N ∑ l e i k ⋅ R l φ n ( r − R l ) \psi_{\boldsymbol{k} }^{n}(r)=\frac{1}{\sqrt{N} }\sum_{l}\mathrm{e}^{\mathrm{i}\boldsymbol{k}\cdot \boldsymbol{R_{l} } }\varphi_{n}(\boldsymbol{r}-\boldsymbol{R_{l} })
ψ k n ( r ) = N 1 l ∑ e i k ⋅ R l φ n ( r − R l )
这样由原子的轨道波函数线性组合得到晶体中共有化轨道波函数,称为紧束缚近似(TBA)或原子轨道线性组合法(LCAO).之所以说这是一种近似,是因为不同格点孤立原子的波函数通常并不正交.除非这些波函数之间交叠很少,可以近似认为它们正交.
之后便又是量子力学里的那一套处理方法.这里不作概述.最终可以得到电子能谱为
E ( k ) = E n − ∑ s J ( R s ) e − i k ⋅ R s E\left(\boldsymbol{k}\right)=E_{_n}-\sum_{s}J(\boldsymbol{R}_{_s})\mathrm{e}^{-\mathrm{i}\boldsymbol{k}\cdot\boldsymbol{R}_s}
E ( k ) = E n − s ∑ J ( R s ) e − i k ⋅ R s
其中 J ( R s ) J(\boldsymbol{R}_{_s}) J ( R s ) 为格点差 R s = R s l − R l ′ \boldsymbol{R_s}=\boldsymbol{R_sl}-\boldsymbol{R_{l^{'}}} R s = R s l − R l ′ 的函数.又由于在紧束缚近似下,各格点上孤立原子的波函数之间交叠很少,式中求和只涉及最近邻项.而当 R s = 0 \boldsymbol{R}_{_s}=0 R s = 0 时 J ( 0 ) J(0) J ( 0 ) 称为库伦积分或晶场劈裂.当 R s ≠ 0 \boldsymbol{R}_{_s}\ne 0 R s = 0 时 J ( R s ) J(\boldsymbol{R}_{_s}) J ( R s ) 称为交叠积分,于是
E ( k ) = E n − J ( 0 ) − ∑ s ≠ 0 最近邻 J ( R s ) e − i k ⋅ R s E(\boldsymbol{k})=E_n-J(0)-\sum_{s\neq0}^\text{最近邻}J(\boldsymbol{R_s})\mathrm{e}^{-\mathrm{i}\boldsymbol{k}\cdot \boldsymbol{R_s} }
E ( k ) = E n − J ( 0 ) − s = 0 ∑ 最近邻 J ( R s ) e − i k ⋅ R s
因为 k \boldsymbol{k} k 限制在第一布里渊区中,取 N N N 个准连续的值,于是一个孤立原子的能力分裂成由 N N N 个准连续分布能级构成的能带,能带的中心相对于原子能级 E n E_n E n 有一个小的平移 − J ( 0 ) -J(0) − J ( 0 ) .从上面的讨论可见,在 N N N 个原子相距较远时,如果原子的波函数不交叠,整个体系的单电子态是 N N N 重简并的.当 N N N 个原子形成晶格时,由于近邻原子波函数的交叠, N N N 重简并消除,展宽成能带. N N N 个简并孤立原子局域态变为 N N N 个由不同 k \boldsymbol{k} k 标记的扩展态.电子退局域,动能将降低.
5. 正交平面波法(OPW)
正交平面波法就是将价带和导带这种在离子实区外的布洛赫波函数用平面波 ∣ k + K h ⟩ \mid \boldsymbol{k+K_{h } }\rangle ∣ k + K h ⟩ 与壳层能带波函数 ∣ ψ c ⟩ \mid \psi _c\rangle ∣ ψ c ⟩ 的线性组合来描述,而 ∣ ψ c ⟩ \mid \psi _c\rangle ∣ ψ c ⟩ 则可用紧束缚近似中的原子轨道线性组合来描述.
∣ ψ k ⟩ = ∑ h a ( k + K h ) ∣ k + K h ⟩ + ∑ c M β c ∣ ψ c ⟩ \mid\psi_{\boldsymbol{k} }\rangle=\sum_{h}a\left(\boldsymbol{k}+\boldsymbol{K_{h} }\right)\mid \boldsymbol{k}+\boldsymbol{K_{h} }\rangle+\sum_{c}^{M}\beta_{c}\mid\psi_{c}\rangle
∣ ψ k ⟩ = h ∑ a ( k + K h ) ∣ k + K h ⟩ + c ∑ M β c ∣ ψ c ⟩
∣ ψ k ⟩ = ∑ h a ( k + K h ) ( ∣ k + K h ⟩ − ∑ c ∣ ψ c ⟩ ⟨ ψ c ∣ k + K h ⟩ ) = ∑ h a ( k + K h ) ∣ O P W k + K h ⟩ \begin{aligned} \mid\psi_{\boldsymbol{k} }\rangle & =\sum_{h}a(\boldsymbol{k}+\boldsymbol{K_{h} })(|\boldsymbol{k}+\boldsymbol{K_{h} }\rangle-\sum_{c}|\psi_{c}\rangle\langle\psi_{c}|\boldsymbol{k}+\boldsymbol{K_{h} }\rangle) \\ & =\sum_{h}a(\boldsymbol{k}+\boldsymbol{K_{h} })|OPW_{\boldsymbol{k}+\boldsymbol{K_{h} } }\rangle \end{aligned}
∣ ψ k ⟩ = h ∑ a ( k + K h ) ( ∣ k + K h ⟩ − c ∑ ∣ ψ c ⟩ ⟨ ψ c ∣ k + K h ⟩ ) = h ∑ a ( k + K h ) ∣ O P W k + K h ⟩
其中 ∣ O P W k ⟩ = ∣ k ⟩ − ∑ c n ∣ ψ c ⟩ ⟨ ψ c ∣ k ⟩ \mid OPW_{\boldsymbol{k} }\rangle=\mid \boldsymbol{k}\rangle-\sum_{c}^{n}\mid\psi_{c}\rangle\langle\psi_{c}\mid \boldsymbol{k}\rangle ∣ O P W k ⟩ = ∣ k ⟩ − ∑ c n ∣ ψ c ⟩ ⟨ ψ c ∣ k ⟩ 称为正交化平面波,它必定能与内壳层能带波函数正交.至于后面的处理方法依然是量子力学里的那一套.
最后同样可以得到一个无穷阶的行列式
det ∣ [ ℏ 2 2 m ( k + K h ) 2 − E ( k ) ] δ K h , K h ′ + ⟨ k + K h ∣ U ∣ k + K h ′ ⟩ ∣ = 0 \det\left|\left[\frac{\hbar^2}{2m}(\boldsymbol{k}+\boldsymbol{K_h)}^2-E(\boldsymbol{k})\right]\delta_{\boldsymbol{K_h},\boldsymbol{K_{h^{\prime} } } }+\langle \boldsymbol{k}+\boldsymbol{K_h}|U|\boldsymbol{k}+\boldsymbol{K_{h^{\prime} } }\rangle\right|=0
det ∣ ∣ ∣ ∣ [ 2 m ℏ 2 ( k + K h ) 2 − E ( k ) ] δ K h , K h ′ + ⟨ k + K h ∣ U ∣ k + K h ′ ⟩ ∣ ∣ ∣ ∣ = 0
其中 U = V + ∑ c [ E ( k ) − E c ] ∣ ψ c ⟩ ⟨ ψ c ∣ U=V+\sum_{c}\left[E(\boldsymbol{k})-\boldsymbol{E}_{c}\right]|\boldsymbol{\psi}_{c}\rangle\langle\boldsymbol{\psi}_{c}| U = V + ∑ c [ E ( k ) − E c ] ∣ ψ c ⟩ ⟨ ψ c ∣ 为有效势.原则上这是一个无穷阶的,但是由于正交化平面波已经很像晶体中的布洛赫波,往往只要取少数几项就足够了.
可以看到与平面波法不同的是,现在用有效势 U U U 代替了真实势 V V V . U U U 的第一项来源于真实势 V V V ,它是负值,第二项来源于正交化手续,它是一个正量.由于正交化手续要求波函数必须与内层电子波函数正交,它在离子实区强烈振荡,功能极大,实际
上起一种排斥势能的作用,它在很大程度上抵消了离子实区 V V V 的吸引作用,从而,使得矩阵元比平面波法中的矩阵元小得多,自然收敛性比平面波法好得多.
6. 赝势方法.
在前面已经看到,正交化平面波法中的正交化项起抵消势能的作用,给出一个比
真实势弱得多的有效势.在此基础上,菲力普斯(J.C.Phillips)和克雷曼(L.Kleinman) 于1959发展了所谓的腰势方法.也就是选取一个合理的赝势,并且可证明该赝势下所得的赝波函数与真实势下的布洛赫波函数具有完全相同的能量本征值(证明见书).固体能带论主要关心的是导带或价带电子的能带结构,而不是波函数的本身.如果我们可以选择适当的赝势,则可以比较容易地求解出基本真实的能谱,因为赝势是一个比真实势平缓得多的函数.在很多情况下,近自由电子近似对于导带或价带电子是一种很好的近似.为什么可以在取微弱变化的周期势的情况下得到相当好的结果,赝势方法正好给出近自由电子近似的一种合理的诠释。
7. 能带电子态密度
电子的态密度和前面的声子态密度大同小异,利用 δ \delta δ 函数的筛选性质,并计入电子的自旋简并,那么对于一个确定的能带 E n ( k ) E_n(\boldsymbol{k}) E n ( k ) ,能带电子态密度可表示为:
N n ( E ) = 2 V ( 2 π ) 3 ∫ Ω ∗ d k δ [ E − E n k ] N_n(E)=\frac{2V}{(2\pi)^3}\int_{\Omega^{*} }d\boldsymbol{k}\delta [E-E_n{\boldsymbol{k} }]
N n ( E ) = ( 2 π ) 3 2 V ∫ Ω ∗ d k δ [ E − E n k ]
其中积分限制在一个倒格子元胞体积之内.如果在 k \boldsymbol{k} k 空间中,能量相等的状态分布在一系列连续的曲面,即等能面上.则和声子态密度同理,电子态密度公式也可写为
{ N n ( E ) = 2 V ( 2 π ) 3 ∫ d S E ∣ ∇ k E n ( k ) ∣ , 三 维 情 况 N n ( E ) = 2 S ( 2 π ) 2 ∫ d l E ∣ ∇ k E n ( k ) ∣ , 二 维 情 况 N n ( E ) = 2 L ( 2 π ) 2 ∣ d E n ( k ) / d k ∣ , 一 维 情 况 \left\{\begin{matrix}N_n(E)=\frac{2V}{(2\pi)^3}\int \frac{dS_{E} }{|\nabla_{\boldsymbol{k} } E_n(\boldsymbol{k})|},三维情况 \\ \\ N_{n}(E)=\frac{2S}{(2\pi)^2}\int \frac{dl_{E} }{|\nabla_{\boldsymbol{k} } E_n(\boldsymbol{k})|},二维情况 \\ \\ N_{n}(E)=\frac{2L}{(2\pi)}\frac{2}{|dE_n(k)/dk|},一维情况 \end{matrix}\right.
⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ N n ( E ) = ( 2 π ) 3 2 V ∫ ∣ ∇ k E n ( k ) ∣ d S E , 三 维 情 况 N n ( E ) = ( 2 π ) 2 2 S ∫ ∣ ∇ k E n ( k ) ∣ d l E , 二 维 情 况 N n ( E ) = ( 2 π ) 2 L ∣ d E n ( k ) / d k ∣ 2 , 一 维 情 况
由此还可以计算出自由电子 E ( k ) = ℏ 2 2 m k 2 E(\boldsymbol{k})=\frac{\hbar^2}{2m}\boldsymbol{k}^2 E ( k ) = 2 m ℏ 2 k 2 的电子态密度为
{ N ( E ) ∝ 1 E , 一 维 情 况 N ( E ) ∝ 常 量 , 二 维 情 况 N ( E ) ∝ E , 三 维 情 况 \left\{\begin{matrix}N(E) \propto \frac{1}{\sqrt{E} },一维情况 \\ \\ N(E) \propto 常量,二维情况 \\ \\ N(E) \propto \sqrt{E},三维情况 \end{matrix}\right.
⎩ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎧ N ( E ) ∝ E 1 , 一 维 情 况 N ( E ) ∝ 常 量 , 二 维 情 况 N ( E ) ∝ E , 三 维 情 况
能态密度是固体电子能谱分布的重要特征.特别是低激发态的能态密度,因为在低温下,这部分状态对配分函数的贡献最大.低能激发态被热运动激发的概率比高能激发态大得多.如果低能散发态的态密度大,体系因热运动而产生的涨落就强,其有序度就要降低,以至于消失,不容易出现有序相.因而低能态密度的大小决定了体系的有序度和相变.
从上面自由电子气模型中,我们已经看到,不同维度的能态密度有决定性的差异.对
于三维体系,低能态密度随 E E E 的减小而趋向于零,因而在低温下热运动所引起的涨落极小,体系在低温下可具有长程序.相反,对于一维体系,低能态密度随 E E E 的减小而趋向无穷,因而即使温度很低,热涨落仍然很强,所以一维体系不能具有长程序.二维系统的低能态密度是常数,介于一维和三维之间,可具有准长程序,并会出现一些特殊相变,例如KT(Kosterlitz-Thouless)相变。
在实际问题中,常常把长链分子聚合,例如聚乙炔,视为由 C H CH C H 单体连成的链状分子.准一维的含义是链,链之间波函数有弱的耦合.在准一维系统中常常出现诸如派尔斯(R.Peirels)失稳、科恩(W.Kohn)反常等物理效应,半导体反型层和异质结构中的电子可以看作典型的二维电子气系统.除此之外,液态氨表面可吸附单层电子,由于泡利原理,液氮表面存在一个超过 1 e V 1eV 1 e V 的势垒阻止电子透入液氮内部,而镜像势又吸引电子于表面,在二维电子气系统中会出现诸如量子霍尔效应、KT相变、分数统计等特有的物理现象.
当然与声子态密度一样,在布里渊区中 ∣ ∇ k E ( k ) ∣ = 0 |\nabla_{\boldsymbol{k} } E(\boldsymbol{k})|=0 ∣ ∇ k E ( k ) ∣ = 0 的那些点, N ( E ) N(E) N ( E ) 将显示某种奇异性,称为范霍夫奇点.其奇点状态和声子态密度一样存在四类,其中两类为极小点和极大点,两类为鞍点.下图是在紧束缚近似下简单立方晶体 s s s 电子的能态密度.
8. 布洛赫电子的动力学性质
严格的经典粒子同时具有确定的坐标和动量.但是,在量子力学中由于不确定性原理,这是不可能的.在量子力学中与经典描述对应的是波包的概念,这个波包的坐标和动量都只具有近似值,其精度由不确定性原理所限制.对于晶体中的电子则可以使用由一定区间内的布洛赫本征态叠加而成的波包来当作经典例子处理.称为准经典近似.
中间具体的推导过程见书.这里只给出结论,某时刻波包的中心位置被认定为电子的坐标,写成矢量形式是:
r = 1 ℏ ∇ k E n ( k ) t \boldsymbol{r}=\frac{1}{\hbar}\nabla_{\boldsymbol{k} }E_n(\boldsymbol{k})t
r = ℏ 1 ∇ k E n ( k ) t
根据不确定性原理, Δ k \Delta \boldsymbol{k} Δ k 越大, Δ r \Delta \boldsymbol{r} Δ r 越小,电子的位置就越确定.但是 Δ k \Delta \boldsymbol{k} Δ k 的范围应远小于布里渊区的尺度 ∣ Δ k ∣ < < 2 π a |\Delta \boldsymbol{k}|<<\frac{2\pi}{a} ∣ Δ k ∣ < < a 2 π ,否则波矢不确定,于是波包的尺度 ∣ Δ r ∣ > > a |\Delta \boldsymbol{r}|>>a ∣ Δ r ∣ > > a .这种意义上,准经典近似成立的条件是,外场应该是时间和空间的缓变函数.外场变化的波长 λ > > a \lambda>>a λ > > a ,而频率 ℏ ω < < E g \hbar \omega << E_g ℏ ω < < E g ,以禁止带间跃迁.
波包是时间的函数,由此很容易定义波包的速度为
v ( k ) = r ˙ = 1 ℏ ∇ k E n ( k ) \boldsymbol{v}(\boldsymbol{k})=\dot{\boldsymbol{r} }=\frac{1}{\hbar}\nabla_{\boldsymbol{k} }E_n(\boldsymbol{k})
v ( k ) = r ˙ = ℏ 1 ∇ k E n ( k )
这样就得到了波包的速度就是波矢为 k \boldsymbol{k} k ,能量为 E n ( k ) E_n(\boldsymbol{k}) E n ( k ) 的布洛赫电子的群速度.严格地讲,由于电子在周期势场中被加速和减速,它们具有空间周期性的瞬时速度,用量子力学的方法,可得到宏观可测的电子平均速度.书上还有个关于波包地群速度等于布洛赫波地平均动量除以电子质量的证明,详情见书.这里不作证明.
对于波包在外场中的运动的推导这里不做描述.总之可得到对于波包的每一个分量,波矢 k k k 均以一个恒定的速率演变.若写作三维情况,则有
ℏ d k ( t ) d t = ℏ k ˙ ( t ) = F \hbar \frac{d\boldsymbol{k}(t)}{dt}=\hbar \dot{\boldsymbol{k} }(t)=\boldsymbol{F}
ℏ d t d k ( t ) = ℏ k ˙ ( t ) = F
它具有和牛顿力学动量表述相似的形式,其中用 ℏ k \hbar \boldsymbol{k} ℏ k 代替了经典力学中的动量.但是,在晶体中 ℏ k \hbar \boldsymbol{k} ℏ k 并不是动量算符的本征值,也不是动量算符的平均值. ℏ k \hbar \boldsymbol{k} ℏ k 称为布洛赫电子的准动量或晶体的
动量.这是因为晶体中的电子既受到外力的作用,也同时受到来自晶格的作用.如果只着眼于外力,外力的作用将改变整个电子、晶格系统的动量,而不单单是电子的动量.
上面给出了布洛赫电子动力学方程的动量表述.在准经典近似下,也可以采用坐标表述.
d v d t = 1 ℏ d d t ∇ k E ( k ) = 1 ℏ ( d k d t ⋅ ∇ k ) ∇ k E ( k ) = ( F ⋅ 1 ℏ 2 ∇ k ) ∇ k E ( k ) \begin{aligned} \frac{d\boldsymbol{v} }{dt} & =\frac{1}{\hbar}\frac{d}{dt}\nabla_{\boldsymbol{k} }E(\boldsymbol{k})=\frac{1}{\hbar}\left(\frac{\mathrm{d}\boldsymbol{k} }{dt}\cdot\nabla_{\boldsymbol{k} }\right)\nabla_{\boldsymbol{k} }E(\boldsymbol{k}) \\ \\ & =(\boldsymbol{F}\cdot\frac{1}{\hbar^{2} }\nabla_{\boldsymbol{k} })\nabla_{\boldsymbol{k} }E(\boldsymbol{k}) \end{aligned}
d t d v = ℏ 1 d t d ∇ k E ( k ) = ℏ 1 ( d t d k ⋅ ∇ k ) ∇ k E ( k ) = ( F ⋅ ℏ 2 1 ∇ k ) ∇ k E ( k )
式中给出了电子的平均加速度与外力的关系.若与牛顿运动方程比较则可以定义电子的有效质量:
( m ∗ ) − 1 = 1 ℏ 2 ∇ k ∇ k E ( k ) (m^{*})^{-1}=\frac{1}{\hbar^2}\nabla_{\boldsymbol{k} }\nabla_{\boldsymbol{k} }E(\boldsymbol{k})
( m ∗ ) − 1 = ℏ 2 1 ∇ k ∇ k E ( k )
这样定义的有效质量并不像通常意义上的标量,而是一个二阶张量.若写作分量形式并转换到主轴坐标上便可使之只含有对角元素:
m α α ∗ d v α d t = F α m_{\alpha \alpha}^{*}\frac{dv_{\alpha} }{dt}=F_{\alpha}
m α α ∗ d t d v α = F α
1 m α α ∗ = 1 ℏ 2 ∂ 2 E ( k ) ∂ k α 2 \frac{1}{m_{\alpha \alpha}^{*} }=\frac{1}{\hbar^2}\frac{\partial^2E(\boldsymbol{k})}{\partial k_{\alpha}^2}
m α α ∗ 1 = ℏ 2 1 ∂ k α 2 ∂ 2 E ( k )
书上以简单立方晶格 s s s 电子紧束缚模型近似能带为例计算了电子的有效质量.并可见晶体中电子对外加场的响应具有有效质量而不是电子的真实质量.除此之外,电子的有效质量取决于电子的状态,因为对于不同的状态,能带的曲率 ∇ k ∇ k E ( k ) \nabla_{\boldsymbol{k} }\nabla_{\boldsymbol{k} }E(\boldsymbol{k}) ∇ k ∇ k E ( k ) 不同,有效质量甚至可以为负值。那是因为电子除了受到外力作用外,还受到晶格的作用.负有效质量的状态出现在能带顶附近,即在布里渊区边界附近.在外力作用下,电子由状态 k \boldsymbol{k} k 变化 Δ k \Delta \boldsymbol{k} Δ k 时,电子转移给点阵的动量大于外力转移给电子的动量,虽然外力使 k \boldsymbol{k} k 增加了 Δ k \Delta \boldsymbol{k} Δ k ,但由于布拉格反射,可以使电子沿外力方向的总动量减小,表现出负的有效质量.
一般而言,对于宽能带, E ( k ) E(\boldsymbol{k}) E ( k ) 随 k \boldsymbol{k} k 的变化较大,有效质量小,而对于窄能带,有效质量较大.从紧束缚近似的观点来看,原子外层电子波函数交叠较多,能带较宽,有效质量较小.而内层电子波函数交叠甚少,能带较窄,有效质量较大,定域性更强一些.
9. 布洛赫电子在恒定电场中的准经典运动
在恒定电场 E \boldsymbol{E} E 中,电子在 k \boldsymbol{k} k 空间的准运动方程变为
ℏ d k d t = − e E \hbar \frac{d \boldsymbol{k} }{dt}=-e \boldsymbol{E}
ℏ d t d k = − e E
其解为
k ( t ) = k ( 0 ) − e E ℏ t \boldsymbol{k}(t)=\boldsymbol{k}(0)-\frac{e\boldsymbol{E} }{\hbar}t
k ( t ) = k ( 0 ) − ℏ e E t
而由于布洛赫电子因其复杂的能带结构 E ( k ) E(\boldsymbol{k}) E ( k ) ,不能直接写出 v ( t ) \boldsymbol{v}(t) v ( t ) 与 k ( t ) \boldsymbol{k}(t) k ( t ) 之间的明显关系,但总可以写作
v [ k ( t ) ] = v [ k ( 0 ) − e E ℏ t ] \boldsymbol{v}[\boldsymbol{k}(t)]=\boldsymbol{v}[\boldsymbol{k}(0)-\frac{e\boldsymbol{E} }{\hbar}t]
v [ k ( t ) ] = v [ k ( 0 ) − ℏ e E t ]
因为 v ( k ) \boldsymbol{v}(\boldsymbol{k}) v ( k ) 是倒空间的周期函数,因此速度是时间的有界函数,当 E \boldsymbol{E} E 平行于一个倒点阵矢量时,速度将随时间振荡.即电子会在 k \boldsymbol{k} k 空间循环运动.
在布洛赫电子的准经典运动的整个过程中,晶格的周期场始终起了关键的作用,这种作用隐含在 E ( k ) E(\boldsymbol{k}) E ( k ) 函数中.由于一个电子载有的电流正比于它的速度,于是在布洛赫电子的准经典模型中,直流电场将感生出交变电流.这种效应通常称为布洛赫振荡.并可以得到振荡周期与振荡频率:
T B = 2 π ℏ e E d , ω B = e E d / ℏ T_B=\frac{2\pi \hbar}{eEd},\qquad \omega_B=eEd/\hbar
T B = e E d 2 π ℏ , ω B = e E d / ℏ
从上面的讨论可以看到,从电子的准经典动力学方程出发,得到违背实验的结果.实验上,施加一个恒定的电场总是测量到一个恒定的电流,原因在于准经典动力学方程是一个无碰撞机制的弹道方程.自由电子模型完全忽略了离子实的散射.布洛赫电子虽然考虑到离子势,但是它作为严格的周期势出现在薛定谔方程中,得到的布洛赫波函数是一个定态解.如果一个电子处于 ψ k n ( r \psi_{\boldsymbol{k} }^n(\boldsymbol{r} ψ k n ( r ) 状态,那么它将具有永不衰减的速度 1 ℏ ∇ k E ( k ) \frac{1}{\hbar}\nabla_{\boldsymbol{k} }E(\boldsymbol{k}) ℏ 1 ∇ k E ( k ) .周期性离子势对电子的散射是一种相干散射。
但是在实际晶体中,碰撞总是存在的.任何导致偏离周期势的机制(例如晶格振动或晶体中的缺陷)都将散射电子,改变电子的速度.这种碰撞是无规则的,定义电子两次碰撞之间的平均自由时间为 τ \tau τ ,称为弛豫时间. 1 τ \frac{1}{\tau} τ 1 就是碰撞概率.因此,只有当 τ > > T B \tau >> T_B τ > > T B ,也就是在两次碰撞间电子在 k \boldsymbol{k} k 空间移动的距离大于布里渊区的尺度时,才能观察到布洛赫振荡.这是一个非常苛刻的条件,要求样品近乎是理想晶体,而且测量温度极低.
如果碰撞存在,那么电子的准经典动力学方程只在两次碰撞之间的时间范围内适用,在外场作用下电子获得动量的增量为 ℏ δ k \hbar \delta \boldsymbol{k} ℏ δ k .碰撞将使电子失去这种增量,它等价于一个平均的阻力,正比于 − ℏ δ k / τ -\hbar \delta \boldsymbol{k}/\tau − ℏ δ k / τ ,它限制在外力作用下 ℏ k \hbar \boldsymbol{k} ℏ k 的无休止增大,导致一种稳定的状态.考虑到上述碰撞机制的存在,电子动力学的唯象方程可写为
ℏ ( d d t + 1 τ ) δ k = F \hbar(\frac{d}{dt}+\frac{1}{\tau})\delta \boldsymbol{k}=\boldsymbol{F}
ℏ ( d t d + τ 1 ) δ k = F
自由粒子加速项为 ( ℏ d d t ) δ k (\hbar \frac{d}{dt})\delta \boldsymbol{k} ( ℏ d t d ) δ k , 而 ℏ δ k τ \frac{\hbar \delta \boldsymbol{k} }{\tau} τ ℏ δ k 表示碰撞效应.对于自由电子模型, m v d = ℏ δ k m \boldsymbol{v_d}=\hbar \delta \boldsymbol{k} m v d = ℏ δ k ,则运动方程为
m ( d d t + 1 τ ) v d = F m(\frac{d}{dt}+\frac{1}{\tau})\boldsymbol{v_d}=\boldsymbol{F}
m ( d t d + τ 1 ) v d = F
其中 v d \boldsymbol{v_d} v d 为电子在外场和碰撞作用下的平均速度,也称为漂移速度,用它去处理固体中的输运过程称为漂移速度理(因为 v d \boldsymbol{v_d} v d 只与动量的增量有关,它是叠加在费米速度之上,沿外力方向速度,费米速度对所有电子平均为0,对电导无贡献.)
对于恒定电场的定态情况, d v ) d / d t = 0 d\boldsymbol{v)d}/dt=0 d v ) d / d t = 0 , F = − e E \boldsymbol{F}=-e\boldsymbol{E} F = − e E ,则可得到电导率
σ = n e 2 τ m \sigma =\frac{ne^2\tau}{m}
σ = m n e 2 τ
上述理论仅仅是描述自由电子气的简单唯象理论.对于布洛赫电子,考虑到能带结构,不是所有参与导电的电子都具有相同的有效质量 m ∗ m^{*} m ∗ 和相同的弛豫时间 τ \tau τ ,它们都与电子的状态 k \boldsymbol{k} k 有关,必须考虑电子状态按能量的分布.详细的金属电导理论会在第五章讲解.
布洛赫电子准经典运动方程的一个直接结论是,如果一个能带所有状态都被电子占据,那么这些电子对电流没有贡献.这从固体能带结构的对称性 E n ( k ) = E n ( − k ) E_n(\boldsymbol{k})=E_n(\boldsymbol{-k}) E n ( k ) = E n ( − k ) 来看是显然的.即由 v ( k ) = r ˙ = 1 ℏ ∇ k E n ( k ) \boldsymbol{v}(\boldsymbol{k})=\dot{\boldsymbol{r} } =\frac{1}{\hbar}\nabla_{\boldsymbol{k} }E_n(\boldsymbol{k}) v ( k ) = r ˙ = ℏ 1 ∇ k E n ( k ) 可直接得到 v ( k ) = v ( − k ) \boldsymbol{v}(\boldsymbol{k})=\boldsymbol{v}(\boldsymbol{-k}) v ( k ) = v ( − k ) ,则对于一个完全填满电子的能带,尽管每个电子都荷载一定的电流,但由于有一个 k \boldsymbol{k} k 态电子,必有一个 − k \boldsymbol{-k} − k 态电子,因此总电流为0, I ≡ 0 \boldsymbol{I}\equiv 0 I ≡ 0 .对于在外加恒定电场作用下,由于能带结构在倒空间的周期性可得在任何时刻下外场作用并不改变均匀填充各 k \boldsymbol{k} k 状态得情况,仍然保持满带电子的对称分布, I ≡ 0 \boldsymbol{I}\equiv 0 I ≡ 0 .
然后是空穴的引入,即满带一旦缺少了少数电子便构成近满带,就会具有一定的导电性.而显然易见(具体见书),近满带的电流就如同一个带有正电荷 e e e 的粒子所荷载的,它具有失去的态电子相同的速度.这个假想的粒子称为空穴.一个缺少了少数电子的近满带的性质应该由剩下的所有电子来决定,现在可用少数空穴去代替它,当然是很方便的.空穴的波矢,能量,速度,有效质量都与真实电子相反,这也是显然的.
十分明显,如果在一种固体中,存在着未填满的能带,那么它必定是导体.如果所有能带中,只有全满带或全空带,那么它是绝缘.半导体在绝对零度下,所有能带是全满或全空,但禁带很窄,在有限温度下有少量的满带电子被激发到空带中,形成有少量空穴的价带和少量电子的导带.
因为对一个具有 N N N 个初基元胞的晶体,每个能带可容纳 2 N 2N 2 N 个电子.因此每个初基元胞中有奇数个价电子的晶体必定是导体.对于每个初基元胞中有偶数个价电子的晶体,如果存在能带的重叠,则是导体;如果存在小的带隙(1 e V 1eV 1 e V ),则是半导体;如果存在大的带隙,则是绝缘体.
10. 布洛赫电子在恒定磁场中的准经典运动
在恒定磁场 B \boldsymbol{B} B 中,电子在 k \boldsymbol{k} k 空间的准经典运动方程是
{ ℏ k ˙ = − e v ( k ) × B v ( k ) = r ˙ = 1 ℏ ∇ k E ( k ) \left\{\begin{matrix}\hbar\dot{\boldsymbol{k} } =-e\boldsymbol{v}(\boldsymbol{k})\times\boldsymbol{B} \\ \boldsymbol{v}(\boldsymbol{k}) =\dot{\boldsymbol{r} }=\frac{1}{\hbar}\nabla_{\boldsymbol{k} }E(\boldsymbol{k}) \end{matrix}\right.
{ ℏ k ˙ = − e v ( k ) × B v ( k ) = r ˙ = ℏ 1 ∇ k E ( k )
由此直接得到, k \boldsymbol{k} k 沿磁场方向的分量和电子的能量是守恒量(运动常量).因此,在 k \boldsymbol{k} k 空间电子沿垂直磁场的平面和等能面的交线运动, v ( k ) \boldsymbol{v}(\boldsymbol{k}) v ( k ) 的方向在 k \boldsymbol{k} k 空间从低能量指向高能量方向.
同时也可得到在 r \boldsymbol{r} r 空间电子轨道在垂直于磁场平面内得投影与 k \boldsymbol{k} k 空间的轨道类似,它们之间的差别仅在于一个比例因子 ℏ / ( e B ) \hbar/(eB) ℏ / ( e B ) 和一个 π / 2 \pi/2 π / 2 的旋转.具体推导见书.
注意,自由电子等能面是一个球面,因此在 k \boldsymbol{k} k 空间的轨道是一个闭合的圆,称为闭轨道.但对于布洛赫电子,等能面不一定是球面,也不一定是闭合的的,因此闭轨道不必是圆,在很多情况下,它们甚至不必是闭合的曲线,称为开轨道.特别地,还存在空穴的轨道.
可以计算电子沿一条能量为 E E E 的轨道从 k 1 \boldsymbol{k_1} k 1 到 k 2 \boldsymbol{k_2} k 2 运动的时间(具体过程见书).
t 2 − t 1 = ℏ 2 e B ∂ A 12 ∂ E t_2 - t_1=\frac{\hbar^2}{eB}\frac{\partial A_{12} }{\partial E}
t 2 − t 1 = e B ℏ 2 ∂ E ∂ A 1 2
其中 ∂ A 12 ∂ E \frac{\partial A_{12} }{\partial E} ∂ E ∂ A 1 2 是 k 1 \boldsymbol{k_1} k 1 和 k 2 \boldsymbol{k_2} k 2 间的一段轨道沿着 E E E 增加单位能量间隔扫过的面积.对于闭合轨道,则可以得到电子沿轨道回旋的周期
T ( E , k z ) = ℏ 2 e B ∂ A ( E , k z ) ∂ E T(E,k_z)=\frac{\hbar^2}{eB}\frac{\partial A(E,k_z)}{\partial E}
T ( E , k z ) = e B ℏ 2 ∂ E ∂ A ( E , k z )
其中 A ( E , k z ) A(E,k_z) A ( E , k z ) 是能量为 E E E 的等能面在垂直于磁场且 k z k_z k z 为一定值的平面内的闭合轨道的面积.回旋频率为:
ω c ( E , k z ) = 2 π e B ℏ 2 [ ∂ A ( E , k z ) ∂ E ] − 1 \omega_c(E,k_z)=\frac{2\pi eB}{\hbar^2}[\frac{\partial A(E,k_z)}{\partial E}]^{-1}
ω c ( E , k z ) = ℏ 2 2 π e B [ ∂ E ∂ A ( E , k z ) ] − 1
如果考虑自由电子气,等能面是球面,E ( k ) = ℏ 2 2 m k 2 = ℏ 2 2 m ( k x 2 + k y 2 + k z 2 ) E(\boldsymbol{k})=\frac{\hbar^2}{2m}\boldsymbol{k}^2=\frac{\hbar^2}{2m}(k_x^2+k_y^2+k_z^2) E ( k ) = 2 m ℏ 2 k 2 = 2 m ℏ 2 ( k x 2 + k y 2 + k z 2 ) ,回旋轨道是一个圆,则可得到
ω c ( E , k z ) = e B m \omega_c(E,k_z)=\frac{eB}{m}
ω c ( E , k z ) = m e B
可见对于自由电子,回旋频率依赖于电子的电荷、质量和磁场的大小,而与磁场的方向无关.当磁场大小一定时,所有轨道的回旋频率都是一样的,也就是得到单一的回旋频率.而对于布洛赫电子,则可依次定义回旋有效质量和回旋频率
m c ∗ ( E , k z ) = ℏ 2 2 π ∂ A ( E , k z ) ∂ E m_c^{*}(E,k_z)=\frac{\hbar^2}{2\pi}\frac{\partial A(E,k_z)}{\partial E}
m c ∗ ( E , k z ) = 2 π ℏ 2 ∂ E ∂ A ( E , k z )
ω c ( E , k z ) = e B m c ∗ ( E , k z ) \omega_c(E,k_z)=\frac{eB}{m_c^{*}(E,k_z)}
ω c ( E , k z ) = m c ∗ ( E , k z ) e B
而其中的 m c ∗ ( E , k z ) m_c^{*}(E,k_z) m c ∗ ( E , k z ) 可以不同于以前定义的有效质量 m ∗ m^{*} m ∗ . m c ∗ m_c^{*} m c ∗ 并不单纯地只与一个特定的电子状态相关,还与回旋轨道性质有关.不同的轨道 o m e g a c ( E , k z ) omega_c(E,k_z) o m e g a c ( E , k z ) 也可能不相等.
对于能带电子,如果在能量极值点附近的能谱可写为 E ( k ) = ℏ 2 2 m ∗ k 2 E(\boldsymbol{k})=\frac{\hbar^2}{2m^{*} }\boldsymbol{k}^2 E ( k ) = 2 m ∗ ℏ 2 k 2 ,等能面为球面,具有单一有效质量,那么类似自由电子的情况,
m c ∗ ( E , k z ) = m ∗ m_c^{*}(E,k_z)=m^{*}
m c ∗ ( E , k z ) = m ∗
即回旋有效质量等于电子的有效质量。对于这些电子,具有单一的回旋频率。
如果等能面是一个椭球,其能谱可写为
E ( k ) = ℏ 2 2 ( k x 2 m x ∗ + k y 2 m y ∗ + k z 2 m z ∗ ) E(\boldsymbol{k})=\frac{\hbar^2}{2}(\frac{k_x^2}{m_x^{* } }+\frac{k_y^2}{m_y^{*} }+\frac{k_z^2}{m_z^{*} })
E ( k ) = 2 ℏ 2 ( m x ∗ k x 2 + m y ∗ k y 2 + m z ∗ k z 2 )
设外磁场 B \boldsymbol{B} B 相对于有效质量主轴地方向余弦为 α \alpha α , β \beta β , γ \gamma γ ,即
B = ( α i + β j + γ k ) B \boldsymbol{B}=(\alpha\boldsymbol{i}+\beta\boldsymbol{j}+\gamma \boldsymbol{k} )B
B = ( α i + β j + γ k ) B
则可以计算得回旋有效质量为
1 m c ∗ = ( m x ∗ α 2 + m y ∗ β 2 + m z ∗ γ 2 m x ∗ m y ∗ m z ∗ ) 1 / 2 \frac{1}{m_c^{*} }=(\frac{m_x^{*}\alpha^2+m_y^{*}\beta^2+m_z^{*}\gamma^2}{m_x^{*}m_y^{*}m_z^{*} })^{1/2}
m c ∗ 1 = ( m x ∗ m y ∗ m z ∗ m x ∗ α 2 + m y ∗ β 2 + m z ∗ γ 2 ) 1 / 2
因此,对于一个椭球等能面,电子的回旋频率依赖于磁场的取向.
但是对于一般形状的等能面,不同的截面将具有不同的 ω c \omega_c ω c 值,而总效果将是所有截面贡献的混合.然而如果考虑到各种不同截面贡献的大小,可以发现等能面的横面积为极值的那些截面,通常会起主导的作用.因为不同的非极值轨道的贡献,由于相位的差别互相抵消,但极值轨道附近,诸轨道截面积变化小,相位变化缓慢,回旋频率相对稳定,它被称为稳相原理.于是就有一个回旋频率几乎恒定的轨道宽带,来自这个区域的电子将支配这个效应.实际上,实验上观察到的回旋频率,正是这些极值轨道的贡献.
上面我们从准经典运动方程出发讨论了电子在恒定磁场中的运动.外场作为经典力处理,可得到电子绕磁场沿经典螺旋轨道运动的结果.但是,施加磁场会自动破坏电子状态的基本量子化图像.具体推导这里就不讲了,如果施加一个沿 z z z 方向的均匀磁场 B \boldsymbol{B} B ,利用量子力学的知识选取朗道规范后求解在均匀恒定磁场中电子的薛定谔方程,可得到电子的能量本征值由 k z k_z k z 和磁量子数 n n n 决定:
E ( k z , n ) = ℏ 2 2 m k z 2 + ( n + 1 2 ) ℏ ω c , n = 0 , 1 , 2 , . . . E(k_z,n)=\frac{\hbar^2}{2m}k_z^2+\left(n+\frac{1}{2}\right)\hbar\omega_c,\quad n=0,1,2,...
E ( k z , n ) = 2 m ℏ 2 k z 2 + ( n + 2 1 ) ℏ ω c , n = 0 , 1 , 2 , . . .
其中 ω c = e B m \omega_c=\frac{eB}{m} ω c = m e B 就是前面提到的回旋频率,而上式称为朗道能级.这样磁场把 k \boldsymbol{k} k 空间等分成一些横截面为常量的朗道管,它们对应于恒定磁量子数的各个状态.对于一个确定的 k z k_z k z 平面,原先准连续的电子动能 ℏ 2 ( k x 2 + k y 2 ) / ( 2 m ) \hbar^2(k_x^2+k_y^2)/(2m) ℏ 2 ( k x 2 + k y 2 ) / ( 2 m ) ,将以 ℏ ω c \hbar \omega_c ℏ ω c 为单位量子化,重新简并到不同 n n n 的朗道环上.每一个状态为了聚集在离它最近的朗道管面上,便稍微改变一下自己的能量(或上或下).平均说来这个过程对系统的总能量无甚影响,因为能量上移的状态被能量下移的状态补偿得差不多.下图描绘了在均匀磁场下一个球形等能面(费米面)内状态的占据情况.
相邻两个朗道环的截面积之差为
Δ A = π Δ ( k x 2 + k y 2 ) = 2 π m Δ E ℏ 2 = 2 π m ℏ ω c ℏ 2 = 2 π e B ℏ \Delta A=\pi\Delta(k_{x}^{2}+k_{y}^{2})=\frac{2\pi m\Delta E}{\hbar^{2} }=\frac{2\pi m\hbar\omega_{c} }{\hbar^{2} }=\frac{2\pi eB}{\hbar}
Δ A = π Δ ( k x 2 + k y 2 ) = ℏ 2 2 π m Δ E = ℏ 2 2 π m ℏ ω c = ℏ 2 π e B
它是一个正比于外磁场 B \boldsymbol{B} B 的常量.因此,电子在 k \boldsymbol{k} k 空间中的回旋轨道面积是以 2 π e B ℏ \frac{2\pi eB}{\hbar} ℏ 2 π e B 为单位量子化的.原因在于角动量与 k \boldsymbol{k} k 空间轨道面积成正比,角动量的量子化导致了轨道面积的量子化.
粗略地认为在 k z k_z k z 固定的平面内,相邻两个朗道环之间的状态都被聚集到一个朗道环上,容易得到它的简并度是
D = 2 L 2 ( 2 π ) 2 Δ A = e π ℏ B L 2 D=\frac{2L^{2} }{\left(2\pi\right)^{2} }\Delta A=\frac{e}{\pi\hbar}BL^{2}
D = ( 2 π ) 2 2 L 2 Δ A = π ℏ e B L 2
在 1 T 1T 1 T 磁场下,若 L = 1 c m L=1cm L = 1 c m ,简并度约为 1 0 11 10^{11} 1 0 1 1 ,因此每个朗道能级都是高度简并.
如果考虑布洛赫电子,问题要困难得多,因为必须求解在磁场和晶格周期势场中的单电子薛定谔方程.但是,任何粒子随时间作周期性回旋运动,其角动量都可以按玻尔-索末菲关系量子化:
∮ p ⋅ d r = ( n + γ ) h = ( n + γ ) 2 π ℏ \oint \boldsymbol{p}\cdot d \boldsymbol{r}=(n+\gamma)h=(n+\gamma)2\pi\hbar
∮ p ⋅ d r = ( n + γ ) h = ( n + γ ) 2 π ℏ
后面懒得写了,最后可得到
A ( n , k z ) = 2 π e B ℏ ( n + γ ) A(n,k_z)=\frac{2\pi eB}{\hbar}(n+\gamma)
A ( n , k z ) = ℏ 2 π e B ( n + γ )
即在 k \boldsymbol{k} k 空间闭合轨道的面积是以 2 π e B ℏ \frac{2\pi e B}{\hbar} ℏ 2 π e B 为单位量子化的,这与自由电子的情况是一致的.
作为一个好的近似,取
∂ A ( n , k z ) ∂ E = A ( n + 1 , k z ) − A ( n , k z ) E n + 1 ( k z ) − E n ( k z ) \frac{\partial A(n,k_z)}{\partial E}=\frac{A(n+1,k_z)-A(n,k_z)}{E_{n+1}(k_z)-E_n(k_z)}
∂ E ∂ A ( n , k z ) = E n + 1 ( k z ) − E n ( k z ) A ( n + 1 , k z ) − A ( n , k z )
可得到
E n + 1 ( k z ) − E n ( k z ) = ℏ ω c E_{_{n+1} }(k_{_z})-E_{_n}(k_{_z})=\hbar\omega_{_c}
E n + 1 ( k z ) − E n ( k z ) = ℏ ω c
即相邻闭合轨道的能量差为普朗克常量与在该轨道上准经典运动回旋频率的乘积.
11. 布洛赫电子在相互垂直的恒定电场和磁场中的运动
关于从自由电子气的漂移速度理论去讨论电子在恒定电场和磁场中的运动这里就不写了,详情可以看书.由于该理论过于粗糙,且无法解释磁致电阻,所以需要采用其它模型.下面是一个简单双能带模型的粒子.
现在假定存在两种类型的载流子.每种载流子分别具有单一的有效质量 m 1 m_1 m 1 和 m 2 m_2 m 2 以及平均弛豫时间 τ 1 \tau_1 τ 1 和 τ 2 \tau_2 τ 2 .这样,每种载流子分别满足下述运动方程:
{ m 1 ( d d t + 1 τ 1 ) v 1 = − e ( E + v 1 × B ) m 2 ( d d t + 1 τ 2 ) v 2 = − e ( E + v 2 × B ) \left\{\begin{matrix}m_{1}\left(\frac{\mathrm{d} }{\mathrm{d}t}+\frac{1}{\tau_{1} }\right)\boldsymbol{v}_{1}=-e(\boldsymbol{E}+\boldsymbol{v}_{1}\times\boldsymbol{B}) \\ \\ m_{2}\left(\frac{\mathrm{d} }{\mathrm{d}t}+\frac{1}{\tau_{2} }\right)\boldsymbol{v}_{2}=-e(\boldsymbol{E}+\boldsymbol{v}_{2}\times\boldsymbol{B}) \end{matrix}\right.
⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ m 1 ( d t d + τ 1 1 ) v 1 = − e ( E + v 1 × B ) m 2 ( d t d + τ 2 1 ) v 2 = − e ( E + v 2 × B )
假定磁场 B \boldsymbol{B} B 平行 z z z 轴,电场 E \boldsymbol{E} E 在 x − y x-y x − y 平面内,则可以得到每种载流子在 x − y x-y x − y 平面内的电流分量:
{ ( J 1 x J 1 y ) = σ 1 1 + ( ω 1 τ 1 ) 2 ( 1 − ω 1 τ 1 ω 1 τ 1 1 ) ( E x E y ) ( J 2 x J 2 y ) = σ 2 1 + ( ω 2 τ 2 ) 2 ( 1 − ω 2 τ 2 ω 2 τ 2 1 ) ( E x E y ) \left\{\begin{matrix}\begin{pmatrix} J_{1x} \\ \\ J_{1y} \end{pmatrix}=\frac{\sigma_1}{1+(\omega_1\tau_1)^2} \begin{pmatrix} 1 & & -\omega_1\tau_1 \\ \\ \omega_1\tau_1 & & 1 \end{pmatrix} \begin{pmatrix} E_x \\ \\ E_y \end{pmatrix} \\ \\ \begin{pmatrix} J_{2x} \\ \\ J_{2y} \end{pmatrix}=\frac{\sigma_2}{1+(\omega_2\tau_2)^2} \begin{pmatrix} 1 & & -\omega_2\tau_2 \\ \\ \omega_2\tau_2 & & 1 \end{pmatrix} \begin{pmatrix} E_x \\ \\ E_y \end{pmatrix} \end{matrix}\right.
⎩ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎧ ⎝ ⎛ J 1 x J 1 y ⎠ ⎞ = 1 + ( ω 1 τ 1 ) 2 σ 1 ⎝ ⎛ 1 ω 1 τ 1 − ω 1 τ 1 1 ⎠ ⎞ ⎝ ⎛ E x E y ⎠ ⎞ ⎝ ⎛ J 2 x J 2 y ⎠ ⎞ = 1 + ( ω 2 τ 2 ) 2 σ 2 ⎝ ⎛ 1 ω 2 τ 2 − ω 2 τ 2 1 ⎠ ⎞ ⎝ ⎛ E x E y ⎠ ⎞
式中, ω i = e B m i \omega_{i}=\frac{eB}{m_{i} } ω i = m i e B , σ i = n i e 2 τ i m i \sigma_{i}=\frac{n_{i}e^{2}\tau_{i} }{m_{i} } σ i = m i n i e 2 τ i , i = 1 , 2 i=1,2 i = 1 , 2 , n 1 n_1 n 1 和 n 2 n_2 n 2 分别为每种载流子的浓度.在 x − y x-y x − y 平面内总电流 J = J 1 + J 2 \boldsymbol{J}=\boldsymbol{J_1}+\boldsymbol{J_2} J = J 1 + J 2 ,其分量可写为
( J x J y ) = ( σ 1 1 + ( ω 1 τ 1 ) 2 + σ 2 1 + ( ω 2 τ 2 ) 2 − σ 1 ω 1 τ 1 1 + ( ω 1 τ 1 ) 2 − σ 2 ω 2 τ 2 1 + ( ω 2 τ 2 ) 2 σ 1 ω 1 τ 1 1 + ( ω 1 τ 1 ) 2 + σ 2 ω 2 τ 2 1 + ( ω 2 τ 2 ) 2 σ 1 1 + ( ω 1 τ 1 ) 2 + σ 2 1 + ( ω 2 τ 2 ) 2 ) ( E x E y ) \begin{pmatrix} J_{x} \\ J_{y} \end{pmatrix}= \begin{pmatrix} \frac{\sigma_{1} }{1+\left(\omega_{1}\tau_{1}\right)^{2} }+\frac{\sigma_{2 } }{1+\left(\omega_{2}\tau_{2}\right)^{2} } & -\frac{\sigma_{1}\omega_{1}\tau_{1} }{1+\left(\omega_{1}\tau_{1}\right)^{2} }-\frac{\sigma_{2}\omega_{2}\tau_{2} }{1+\left(\omega_{2}\tau_{2}\right)^{2} } \\ \\ \frac{\sigma_{1}\omega_{1}\tau_{1} }{1+\left(\omega_{1}\tau_{1}\right)^{2} }+\frac{\sigma_{2}\omega_{2}\tau_{2} }{1+\left(\omega_{2}\tau_{2}\right)^{2} } & \frac{\sigma_{1} }{1+\left(\omega_{1}\tau_{1}\right)^{2} }+\frac{\sigma_{2} }{1+\left(\omega_{2}\tau_{2}\right)^{2} } \end{pmatrix} \begin{pmatrix} E_{x} \\ \\ E_{y} \end{pmatrix}
( J x J y ) = ⎝ ⎜ ⎛ 1 + ( ω 1 τ 1 ) 2 σ 1 + 1 + ( ω 2 τ 2 ) 2 σ 2 1 + ( ω 1 τ 1 ) 2 σ 1 ω 1 τ 1 + 1 + ( ω 2 τ 2 ) 2 σ 2 ω 2 τ 2 − 1 + ( ω 1 τ 1 ) 2 σ 1 ω 1 τ 1 − 1 + ( ω 2 τ 2 ) 2 σ 2 ω 2 τ 2 1 + ( ω 1 τ 1 ) 2 σ 1 + 1 + ( ω 2 τ 2 ) 2 σ 2 ⎠ ⎟ ⎞ ⎝ ⎛ E x E y ⎠ ⎞
于是在低磁场情况下, ω 1 τ 1 < < 1 \omega_1 \tau_1 <<1 ω 1 τ 1 < < 1 , ω 2 τ 2 < < 1 \omega_2 \tau_2 <<1 ω 2 τ 2 < < 1 ,如果在 x x x 方向测定电流,电流不能从 y y y 方向流出去,则令 J y = 0 J_y=0 J y = 0 ,可以得到
{ J x = ( σ 1 + σ 2 ) E x − ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E y J y = ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E x + ( σ 1 + σ 2 ) E y = 0 \left\{\begin{matrix}J_{_x}=(\sigma_{_1}+\sigma_{_2})E_{_x}-(\sigma_{_1}\omega_{_1}\tau_{_1}+\sigma_{_2}\omega_{_2}\tau_{_2})E_{_y} \\ \\J_{_y}=(\sigma_{_1}\omega_{_1}\tau_{_1}+\sigma_{_2}\omega_{_2}\tau_{_2})E_{_x}+(\sigma_{_1}+\sigma_{_2})E_{_y}=0 \end{matrix}\right.
⎩ ⎨ ⎧ J x = ( σ 1 + σ 2 ) E x − ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E y J y = ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E x + ( σ 1 + σ 2 ) E y = 0
则可得
E x = − σ 1 + σ 2 σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 E y E_x=-\frac{\sigma_1+\sigma_2}{\sigma_1\omega_1\tau_1+\sigma_2\omega_2\tau_2}E_y
E x = − σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 σ 1 + σ 2 E y
于是可以得到霍尔系数
R H = E y B J x = − σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 B ( σ 1 + σ 2 ) 2 = σ 1 2 R 1 + σ 2 2 R 2 ( σ 1 + σ 2 ) 2 R_{_\mathrm{H} }=\frac{E_{_y} }{BJ_{_x} }=-\frac{\sigma_{_1}\omega_{_1}\tau_{_1}+\sigma_{_2}\omega_{_2}\tau_{_2} }{B\left(\sigma_{_1}+\sigma_{_2}\right)^{2} }=\frac{\sigma_{_1}^{2}R_{_1}+\sigma_{_2}^{2}R_{_2} }{\left(\sigma_{_1}+\sigma_{_2}\right)^{2} }
R H = B J x E y = − B ( σ 1 + σ 2 ) 2 σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 = ( σ 1 + σ 2 ) 2 σ 1 2 R 1 + σ 2 2 R 2
式中 R 1 = − 1 n 1 e R_1=-\frac{1}{n_1e} R 1 = − n 1 e 1 , R 2 = − 1 n 2 e R_2=-\frac{1}{n_2e} R 2 = − n 2 e 1 , R 1 R_1 R 1 和 R 2 R_2 R 2 为每种载流子单独存在的霍尔系数.
而在高磁场情况下. ω 1 τ 1 > > 1 \omega_1 \tau_1 >>1 ω 1 τ 1 > > 1 , ω 2 τ 2 > > 1 \omega_2 \tau_2 >>1 ω 2 τ 2 > > 1 ,同理也可得到
{ J x = [ σ 1 ( ω 1 τ 1 ) 2 + σ 2 ( ω 2 τ 2 ) 2 ] E x − ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E y J y = ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) E x + [ σ 1 ( ω 1 τ 1 ) 2 + σ 2 ( ω 2 τ 2 ) 2 ] E y = 0 \left\{\begin{matrix}J_x=\left[\frac{\sigma_1}{\left(\omega_1\tau_1\right)^2}+\frac{\sigma_2}{\left(\omega_2\tau_2\right)^2}\right]E_x-\left(\frac{\sigma_1}{\omega_1\tau_1}+\frac{\sigma_2}{\omega_2\tau_2}\right)E_y \\ \\ J_{y}=\left(\frac{\sigma_{1} }{\omega_{1}\tau_{1} }+\frac{\sigma_{2} }{\omega_{2}\tau_{2} }\right)E_{x}+\left[\frac{\sigma_{1} }{\left(\omega_{1}\tau_{1}\right)^{2} }+\frac{\sigma_{2} }{\left(\omega_{2}\tau_{2}\right)^{2} }\right]E_{y}=0 \end{matrix}\right.
⎩ ⎪ ⎪ ⎨ ⎪ ⎪ ⎧ J x = [ ( ω 1 τ 1 ) 2 σ 1 + ( ω 2 τ 2 ) 2 σ 2 ] E x − ( ω 1 τ 1 σ 1 + ω 2 τ 2 σ 2 ) E y J y = ( ω 1 τ 1 σ 1 + ω 2 τ 2 σ 2 ) E x + [ ( ω 1 τ 1 ) 2 σ 1 + ( ω 2 τ 2 ) 2 σ 2 ] E y = 0
于是可得到在高场极限下的霍尔系数:
R H = E y B J x = − 1 B ( σ 1 ω 1 τ 1 + σ 2 ω 2 τ 2 ) = − 1 ( n 1 + n 2 ) e = − 1 n e f f e R_{\mathrm{H} }=\frac{E_{y} }{BJ_{x} }=-\frac{1}{B\left(\frac{\sigma_{1} }{\omega_{1}\tau_{1} }+\frac{\sigma_{2} }{\omega_{2}\tau_{2} }\right)}=-\frac{1}{\left(n_{1}+n_{2}\right)e}=-\frac{1}{n_{\mathrm{eff} }e}
R H = B J x E y = − B ( ω 1 τ 1 σ 1 + ω 2 τ 2 σ 2 ) 1 = − ( n 1 + n 2 ) e 1 = − n e f f e 1
其中 n e f f = n 1 + n 2 n_{eff}=n_1+n_2 n e f f = n 1 + n 2 是载流子的总密度.可见在高场极限下霍尔效应的理论变得很简单,两种载流子的个性表现不出来.这些在后面半导体的霍尔效应中也会用到,并可以看到其随温度变化会有不同的变化,并且高场下霍尔系数与载流子浓度成反比,通过测量半导体的霍尔系数不仅可以得到载流子的浓度,还可以确定半导体的类型.
然后是关于磁致电阻的计算 ρ = E x / J x \rho=E_x/J_x ρ = E x / J x ,关于计算过程就不写了.若将其与不存在磁场时的电阻率 ρ 0 = 1 / ( σ 1 + σ 2 ) \rho_0=1/(\sigma_1 +\sigma_2) ρ 0 = 1 / ( σ 1 + σ 2 ) 进行比较,可得到
Δ ρ ρ 0 = ρ − ρ 0 ρ 0 = σ 1 σ 2 ( μ 1 − μ 2 ) 2 B 2 ( σ 1 + σ 2 ) 2 + ( μ 1 σ 1 + μ 2 σ 2 ) 2 B 2 \frac{\Delta\rho}{\rho_0}=\frac{\rho-\rho_0}{\rho_0}=\frac{\sigma_1\sigma_2(\mu_1-\mu_2)^2B^2}{(\sigma_1+\sigma_2)^2+(\mu_1\sigma_1+\mu_2\sigma_2)^2B^2}
ρ 0 Δ ρ = ρ 0 ρ − ρ 0 = ( σ 1 + σ 2 ) 2 + ( μ 1 σ 1 + μ 2 σ 2 ) 2 B 2 σ 1 σ 2 ( μ 1 − μ 2 ) 2 B 2
在这个公式的推导中,简单地假定能带中的载流子可以分为两组,每一组载流子具有不同的有效质量,不同的弛豫时间,甚至不同的电荷(例如空穴的电荷可以是正的).实际情况是
载流子的状态应该有一定的分布,情况将要复杂得多.尽管如此,上式仍然给出了磁致电阻现象的主要特征.
在低磁场情况下时
Δ ρ ρ 0 ≈ σ 1 σ 2 ( μ 1 − μ 2 ) 2 ( σ 1 + σ 2 ) 2 B 2 \frac{\Delta\rho}{\rho_0}\approx\frac{\sigma_1\sigma_2(\mu_1-\mu_2)^2}{(\sigma_1+\sigma_2)^2}B^2
ρ 0 Δ ρ ≈ ( σ 1 + σ 2 ) 2 σ 1 σ 2 ( μ 1 − μ 2 ) 2 B 2
磁致电阻正比于 B 2 \boldsymbol{B}^2 B 2
在高磁场极限下时
Δ ρ ρ 0 ≈ σ 1 σ 2 ( μ 1 − μ 2 ) 2 ( μ 1 σ 1 + μ 2 σ 2 ) 2 \frac{\Delta\rho}{\rho_0}\approx\frac{\sigma_1\sigma_2(\mu_1-\mu_2)^2}{(\mu_1\sigma_1+\mu_2\sigma_2)^2}
ρ 0 Δ ρ ≈ ( μ 1 σ 1 + μ 2 σ 2 ) 2 σ 1 σ 2 ( μ 1 − μ 2 ) 2
磁致电阻趋于饱和值。
上述讨论是建立在闭合轨道基础之上的.在外磁场中,所有载流子沿 k \boldsymbol{k} k 空间的闭合轨道运动.实际的能带结构可能存在不闭合的开轨道.如果存在一些电子或空穴的开轨道,上述高场磁电阻的结果会产生戏剧性的改变.
在高磁场情况下,上面的方程也可改写为
( J x J y ) = ( σ x x 1 R H B − 1 R H B σ y y ) ( E x E y ) \begin{pmatrix} J_x \\ \\ J_y \end{pmatrix}= \begin{pmatrix} & \sigma_{xx} & & \frac{1}{R_\mathrm{H}B} \\ \\ & -\frac{1}{R_\mathrm{H}B} & & \sigma_{yy} \end{pmatrix} \begin{pmatrix} E_x \\ \\ E_y \end{pmatrix}
⎝ ⎛ J x J y ⎠ ⎞ = ⎝ ⎛ σ x x − R H B 1 R H B 1 σ y y ⎠ ⎞ ⎝ ⎛ E x E y ⎠ ⎞
式中
σ x x = σ y y = σ 1 ( ω 1 τ 1 ) 2 + σ 2 ( ω 2 τ 2 ) 2 = ( n 1 m 1 τ 1 + n 2 m 2 τ 2 ) / B 2 = A B 2 \sigma_{xx}=\sigma_{yy}=\frac{\sigma_{1} }{\left(\omega_{1}\tau_{1}\right)^{2} }+\frac{\sigma_{2} }{\left(\omega_{2}\tau_{2}\right)^{2} }=\left(\frac{n_{1}m_{1} }{\tau_{1} }+\frac{n_{2}m_{2} }{\tau_{2} }\right)/B^{2}=\frac{A}{B^{2} }
σ x x = σ y y = ( ω 1 τ 1 ) 2 σ 1 + ( ω 2 τ 2 ) 2 σ 2 = ( τ 1 n 1 m 1 + τ 2 n 2 m 2 ) / B 2 = B 2 A
R H = − 1 ( n 1 + n 2 ) e = − 1 n e f f e R_\mathrm{H}=-\frac{1}{(n_1+n_2)e}=-\frac{1}{n_\mathrm{eff}e}
R H = − ( n 1 + n 2 ) e 1 = − n e f f e 1
其中 A A A 为常数, R H R_H R H 为高场下的霍尔系数.于是可得霍尔系数
ρ = E x J x = 1 σ x x + 1 / ( R H 2 B 2 σ y y ) \rho=\frac{E_{_x} }{J_{_x} }=\frac{1}{\sigma_{_{xx} }+1/(R_{_H}^2B^2\sigma_{_{yy} })}
ρ = J x E x = σ x x + 1 / ( R H 2 B 2 σ y y ) 1
如果所有的轨道都是闭轨道,在高场极限情况下,σ x x = σ y y → 0 \sigma_{xx}=\sigma_{yy}\to 0 σ x x = σ y y → 0 ,因此,磁致电阻
ρ ≈ A R H 2 \rho \approx AR_H^2
ρ ≈ A R H 2
这正是磁致电阻趋于饱和的结果.
但是对于开轨道载,流子不会由于磁场的存在被迫在电场方向作周期性运动.磁场不再有效地阻止载流子从驱动电场中获取能量.如果一个能带的开轨道在 k \boldsymbol{k} k 空间沿 k z k_z k z 方向延伸,如图所示,由于载流子在 r \boldsymbol{r} r 空间垂直于磁场平面的投影轨道相对于 k \boldsymbol{k} k 空间轨道旋转 π 2 \frac{\pi}{2} 2 π ,因此在高场极限下,这样的开轨道中的载流子在 r \boldsymbol{r} r 空间 y y y 方向对电流的贡献不为零, σ y y \sigma_{yy} σ y y 就不会随磁场的增大而趋于零,而是趋于一个常量, σ y y → S \sigma_{yy} \to S σ y y → S .
并且可得到
ρ = 1 A B 2 + 1 R H 2 B 2 S → B 2 A + 1 R H 2 S \rho=\frac{1}{\frac{A}{B^{2} }+\frac{1}{R_{\mathrm{H} }^{2}B^{2}S} }\to\frac{B^{2} }{A+\frac{1}{R_{\mathrm{H} }^{2}S} }
ρ = B 2 A + R H 2 B 2 S 1 1 → A + R H 2 S 1 B 2
磁致电阻正比于 B 2 \boldsymbol{B}^2 B 2 而无限增加.
整个磁致电阻效应始终与能带结构紧密相关,并受霍尔效应的支配.然而在低磁场情况下,开轨道与闭轨道的差别无关紧要.因为对于闭轨道,由于 ω τ < < 1 \omega \tau <<1 ω τ < < 1 ,载流子在散射前至多不过走完一小段回路.这样,不管电子在散射前所走过的是一段开轨道,还是闭轨道,磁致电阻都是局部曲率、载流子速度等对整个等能面的一个平均.
这个效应对于实验上确定金属等能面的形状十分重要.倘若我们研究一个金属单晶在极高磁场情况下的横向磁致电阻,如果发现,在一些磁场方向磁致电阻是饱和的,而在其他一些方向磁致电阻随磁场的增加而无限增大,那么可以断定,饱和方向对应于等能面的截面为闭合轨道的方向,而磁致电阻随扩增加的方向应该对应某些截面包含开口轨道的方向,等能面必定是多连通的.
12. 能带论的局限性
懒得写了,看书吧
摸鱼摸鱼摸鱼