이데아를 여행하는 히치하이커
Alice in Logicland
© 2026. All rights reserved.
© 2026. 디멘 reserved by 곰댕.
This post was originally written in Korean, and has been machine translated into English. It may contain minor errors or unnatural expressions. Proofreading will be done in the near future.
Consider an open cover $U, V$ of a topological space $X$. In the category of topological spaces $\mathbf{Top}$, the limit of the following pushout diagram is $X$.

The Seifert-van Kampen theorem states that when $U, V$ are path connected and $x_0 \in U \cap V$, the above limit is preserved under the functor $\pi_1(-, x_0): \mathbf{Top} \to \mathbf{Grp}$.

However, the limit of a pushout is the colimit of the left diagram. If the object corresponding to $I$ is an initial object, then the morphisms $I \to J, J \to K$ are uniquely determined, so the colimit of the left diagram is essentially the same as the colimit of the right diagram, which corresponds to the categorical sum.
The initial object in $\mathbf{Grp}$ is the trivial group, and the categorical sum is the free product. Accordingly, when $U \cap V$ is a simply connected space, we obtain the conclusion that $\pi_1(X)$ is the free product of $\pi_1(U)$ and $\pi_1(V)$.
학부 위상에서 곱 위상product topology과 상자 위상box topology을 다루는 부분은 많은 학생에게 난관으로 다가오는 대목이다. 겉보기에는 상자 위상이 훨씬 직관적인데, 교재에서는 상자 위상보다 곱 위상이 다루기에 자연스러운 개념이라고 가르치기 때문이다.
정의. 위상공간의 모임 $\lbrace X_i \rbrace _{i \in I}$에 대해, 상자 위상공간 $\prod X_i$는 다음의 기저로 생성되는 위상공간이다.
\[\left\{ \prod U_i : U_i \text{ is open in } X_i \right\}\]
정의. 위상공간의 모임 $\lbrace X_i \rbrace _{i \in I}$에 대해, 곱 위상공간 $\prod X_i$는 다음의 기저로 생성되는 위상공간이다.
\[\left\{ \prod U_i : U_i \text{ is open in } X_i,\; U_i \neq X_i \text{ for only finitely many } i\right\}\]
일례로 $\mathbb{R}^\omega$에서 $(1, 1, 1, \dots)$의 근방은 각각 다음과 같다.

왜 곱 위상은 상자 위상보다 자연스러운 위상으로 간주될까? 그 이유는 범주론에서 대상의 곱을 정의하는 방법과 관련이 있다.
정의. $X, Y$가 범주 $\mathcal{A}$의 대상이라고 하자. $P \in \mathcal{A}$와 사상 $\pi_X : P \to X$, $\pi_Y : P \to Y$에 대해, 다음 조건이 만족될 때 $P$를 $X, Y$의 곱product이라고 하며, $P = X \times Y$와 같이 적는다.
- 임의의 $A \in \mathcal{A}$와 $f: A \to X$, $g: A \to Y$에 대해 다음 도식이 가환이 되도록 하는 사상 $i: A \to P$가 언제나 유일하게 존재한다.
위의 정의는 자연스러운 방식으로 3개 이상, 또는 무한한 대상들의 곱으로 일반화된다. 극한limit의 개념이 익숙한 독자라면, 곱은 이산 범주의 극한으로 이해할 수 있다. 또는, 곱은 주어진 대상들의 정보를 온전히 인코딩하는 가장 작은 범주로 이해할 수 있다.
집합들의 범주에서 곱은 곱집합과 같다. 특히 $\pi_X, \pi_Y$는 각각 $(x, y) \mapsto x$, $(x, y) \mapsto y$로 주어진다.
위상공간들의 범주에서 곱은 상자 위상이 아닌 곱 위상이다. 이는 다음의 정리로 보증된다.
정리. 사영함수 $\pi_k : \prod_{i \in I}X_i \to X_k$가 각 $k \in I$에 대해 연속이 되도록 하는 가장 작은 $\prod_{i \in I}X_i$의 위상은 곱 위상이다.
상자 위상도 각 사영함수가 연속이라는 특징을 가지지만, 상자 위상은 곱 위상보다 큰 토폴로지이다. 따라서 상자 위상은 범주론적 곱이 아니다.
상자 위상이 곱이 아님을 보이는 반례를 살펴보자. $\mathbb{R}^\omega$에 상자 위상을 부여하자. 만약 상자 위상이 범주론적 곱이라면, 임의의 연속인 $f_k: \mathbb{R} \to \mathbb{R}$에 대해 $\pi_k \circ i = f_k$가 되도록 하는 연속함수 $i : \mathbb{R} \to \mathbb{R}^\omega$가 존재해야 한다. $f_k: x \mapsto kx$라면 $i$는 $x \mapsto (x, 2x, 3x, \dots)$이다. 상자 위상에서는 $U = (0, 1)^\omega$가 열린 집합이므로, $i$가 연속이면 $i^{-1}(U)$가 열린집합이다. 그런데 $i^{-1}(U) = \lbrace 0 \rbrace $이므로, 상자 위상은 곱의 성질을 만족하지 않는다.
상자 위상과 곱 위상의 차이는 전체 공간이 아닌 인덱스가 유한한지의 여부에 있다. 이와 유사한 차이를 대수학에서도 발견할 수 있다.
정의. 벡터 공간들의 모임 $\lbrace V_i \rbrace _{i \in I}$에 대해, 직곱direct product $\prod V_i$를 다음과 같이 정의한다.
\[\prod V_i = \left\{ (v_i)_{i \in I} : v_i \in V_i \right\}\]
정의. 벡터 공간들의 모임 $\lbrace V_i \rbrace _{i \in I}$에 대해, 직합direct sum $\bigoplus V_i$를 다음과 같이 정의한다.
\[\bigoplus V_i = \left\{ (v_i)_{i \in I} : v_i \in V_i,\; v_i \neq 0 \text{ for only finitely many }i \right\}\]
벡터의 연산은 항별term-wise로 정의한다. 또한 벡터 공간이 아닌 군에 대해서도 같은 방식으로 직곱과 직합을 정의할 수 있다.
직곱과 상자 위상, 직합과 곱 위상의 정의가 비슷하다는 점으로부터 직합이 범주론적 곱에 대응된다고 생각할 수 있지만 그렇지 않다. 대수의 경우 범주론적 곱에 대응되는 것은 직곱이다. 직합은 범주론적 곱의 조건을 일반적으로 만족하지 않는다.
일례로 다음의 경우를 보자. 일차원 실수 공간 $\mathbb{R}$의 직합 $\mathbb{R}^\omega$를 고려하자. 만약 직합이 범주론적 곱이라면, 임의의 선형인 $f_k: \mathbb{R} \to \mathbb{R}$에 대해 $\pi_k \circ i = f_k$가 되도록 하는 연속함수 $i : \mathbb{R} \to \mathbb{R}^\omega$가 존재해야 한다. $f_k: x \mapsto x$라면 $i$는 $x \mapsto (x, x, x, \dots)$이다. 그런데 $i(1) = (1, 1, 1, \dots) \notin \mathbb{R}^\omega$이므로, 직합은 곱의 성질을 만족하지 않는다.
대신 직합은 범주론적 합sum에 대응된다. 범주론적 합은 곱의 켤레dual이기 때문에 쌍곱coproduct이라고도 한다.
정의. $X, Y$가 범주 $\mathcal{A}$의 대상이라고 하자. $S \in \mathcal{A}$와 사상 $\sigma_X : X \to S$, $\sigma_Y : Y \to S$에 대해, 다음 조건이 만족될 때 $S$를 $X, Y$의 합sum이라고 하며, $S = X + Y$와 같이 적는다.
- 임의의 $A \in \mathcal{A}$와 $f: X \to A$, $g: Y \to X$에 대해 다음 도식이 가환이 되도록 하는 사상 $i: S \to A$가 언제나 유일하게 존재한다.
앞서 들었던 예시를 다시 보자. 직합 $\bigoplus_\omega \mathbb{R}$를 고려하자. $\sigma_k: \mathbb{R} \to \bigoplus_\omega \mathbb{R}$은 다음과 같이 주어진다.
\[x \mapsto (0, \dots, 0, x, 0, \dots) \quad \text{($x$ is at the $k$th index)}\]$A = \mathbb{R}$이라고 하고, 항등사상 $f_k : \mathbb{R} \to \mathbb{R}$을 고려하자. $\bigoplus_\omega \mathbb{R}$가 범주론적 합이라면 $i \circ \sigma_k = f_k$가 되도록 하는 연속함수 $i : \bigoplus_\omega \mathbb{R} \to \mathbb{R}$가 존재해야 한다. 실제로 이는 다음과 같이 존재한다.
\[i: (x_i)_{i \in \omega} \mapsto \sum_{i \in \omega} x_i\]$\bigoplus_\omega \mathbb{R}$의 원소는 오직 유한한 비자명 항을 가지므로 $i$는 잘 정의됨에 주목하라. 반면, 이 예시는 직곱 $\mathbb{R}^\omega$가 범주론적 합이 아님을 보여준다. 직곱의 경우 $i$가 잘 정의되지 않기 때문이다. 이는 $i$에 $(1, 1, 1, \dots)$를 대입해 보면 알 수 있다.
군의 경우 범주론적 곱과 범주론적 합에 대응되는 연산은 일반적인 군의 범주를 따지냐, 아벨군의 범주를 따지냐에 따라 조금 다르다. 이 부분은 간단한 노트 정도로 남겨둔다.
| 대수적 정의 | 범주론적 정의 | |
|---|---|---|
| 자유곱 | 형식적 단어의 집합 + 병치 연산 | $\mathbf{Grp}$의 합 |
| 직합 | 유한한 비자명 항을 가지는 튜플의 집합 + 항별 연산 | $\mathbf{Ab}$의 합 |
| 직곱 | 튜플의 집합 + 항별 연산 | $\mathbf{Grp}$의 곱 |
Product topology and box topology often stir confusion among many undergraduate students. For, although the box topology appears more intuitive at first glance, textbooks teach that the product topology is the more “natural” concept to work with.
Definition. For a collection of topological spaces $\lbrace X_i \rbrace _{i \in I}$, the box topological space $\prod X_i$ is the topological space generated by the following basis:
\[\left\{ \prod U_i : U_i \text{ is open in } X_i \right\}\]
Definition. For a collection of topological spaces $\lbrace X_i \rbrace _{i \in I}$, the product topological space $\prod X_i$ is the topological space generated by the following basis:
\[\left\{ \prod U_i : U_i \text{ is open in } X_i,\; U_i \neq X_i \text{ for only finitely many } i\right\}\]
For instance, the neighbourhoods of $(1, 1, 1, \dots)$ in $\mathbb{R}^\omega$ are as follows:

Why is the product topology considered more natural than the box topology? The reason is related to how products of objects are defined in category theory.
Definition. Let $X, Y$ be objects in category $\mathcal{A}$. For $P \in \mathcal{A}$ and morphisms $\pi_X : P \to X$, $\pi_Y : P \to Y$, we call $P$ the product of $X, Y$ and write $P = X \times Y$ when the following condition is satisfied:
- For any $A \in \mathcal{A}$ and morphisms $f: A \to X$, $g: A \to Y$, there exists a unique morphism $i: A \to P$ such that the following diagram commutes:
The above definition naturally generalises to products of three or more, or infinitely many objects. Readers familiar with the concept of limits will recognise that the product can be understood as the limit of a discrete category. Alternatively, the product can be understood as the smallest category that fully encodes the information of the given objects.
In the category of sets, the product coincides with the Cartesian product. In particular, $\pi_X, \pi_Y$ are given by $(x, y) \mapsto x$ and $(x, y) \mapsto y$ respectively.
In the category of topological spaces, the product is the product topology, not the box topology. This is seen by the following theorem:
Theorem. The smallest topology on $\prod_{i \in I}X_i$ such that the projection functions $\pi_k : \prod_{i \in I}X_i \to X_k$ are continuous for each $k \in I$ is the product topology.
while the box topology also has the property that each projection function is continuous, the box topology is a larger topology than the product topology. Therefore, the box topology is not the categorical product.
Let us examine a counterexample showing that the box topology is not the categorical product. Consider $\mathbb{R}^\omega$ with the box topology. If the box topology were the categorical product, then for any continuous functions $f_k: \mathbb{R} \to \mathbb{R}$, there would exist a continuous function $i : \mathbb{R} \to \mathbb{R}^\omega$ such that $\pi_k \circ i = f_k$. If $f_k: x \mapsto kx$, then $i$ would be $x \mapsto (x, 2x, 3x, \dots)$. In the box topology, $U = (0, 1)^\omega$ is an open set, so if $i$ were continuous, then $i^{-1}(U)$ would be an open set. However, $i^{-1}(U) = \lbrace 0 \rbrace $, so the box topology does not satisfy the property of a product. (Note that in the case of product topology, $U$ is not an open set.)
The difference between the box topology and product topology lies in whether only finitely many indices are allowed to be non-trivial. A similar difference can be found in algebra.
Definition. For a collection of vector spaces $\lbrace V_i \rbrace _{i \in I}$, the direct product $\prod V_i$ is defined as follows:
\[\prod V_i = \left\{ (v_i)_{i \in I} : v_i \in V_i \right\}\]
Definition. For a collection of vector spaces $\lbrace V_i \rbrace _{i \in I}$, the direct sum $\bigoplus V_i$ is defined as follows:
\[\bigoplus V_i = \left\{ (v_i)_{i \in I} : v_i \in V_i,\; v_i \neq 0 \text{ for only finitely many }i \right\}\]
Vector operations are defined term-wise. The same definitions of direct product and direct sum can be applied to groups as well.
From the similarity between the definitions of direct product and box topology, and direct sum and product topology, one might think that the direct sum corresponds to the categorical product, but this is not the case. In algebra, the direct product corresponds to the categorical product. The direct sum does not generally satisfy the conditions of a categorical product.
Consider the following example: Let us examine the direct sum $\mathbb{R}^\omega$ of one-dimensional real spaces $\mathbb{R}$. If the direct sum were the categorical product, then for any linear maps $f_k: \mathbb{R} \to \mathbb{R}$, there would exist a continuous function $i : \mathbb{R} \to \mathbb{R}^\omega$ such that $\pi_k \circ i = f_k$. If $f_k: x \mapsto x$, then $i$ would be $x \mapsto (x, x, x, \dots)$. However, $i(1) = (1, 1, 1, \dots) \notin \mathbb{R}^\omega$, so the direct sum does not satisfy the property of a product.
Instead, the direct sum corresponds to the categorical sum. The categorical sum is also called a coproduct because it is the dual of the categorical product.
Definition. Let $X, Y$ be objects in category $\mathcal{A}$. For $S \in \mathcal{A}$ and morphisms $\sigma_X : X \to S$, $\sigma_Y : Y \to S$, we call $S$ the sum of $X, Y$ and write $S = X + Y$ when the following condition is satisfied:
- For any $A \in \mathcal{A}$ and morphisms $f: X \to A$, $g: Y \to A$, there exists a unique morphism $i: S \to A$ such that the following diagram commutes:
Let us revisit the earlier example. Consider the direct sum $\bigoplus_\omega \mathbb{R}$. The morphism $\sigma_k: \mathbb{R} \to \bigoplus_\omega \mathbb{R}$ is given by:
\[x \mapsto (0, \dots, 0, x, 0, \dots) \quad \text{($x$ is at the $k$th index)}\]Let $A = \mathbb{R}$ and consider the identity morphism $f_k : \mathbb{R} \to \mathbb{R}$. If $\bigoplus_\omega \mathbb{R}$ is the categorical sum, then there must exist a continuous function $i : \bigoplus_\omega \mathbb{R} \to \mathbb{R}$ such that $i \circ \sigma_k = f_k$. Indeed, this exists as follows:
\[i: (x_i)_{i \in \omega} \mapsto \sum_{i \in \omega} x_i\]Note that $i$ is well-defined because elements of $\bigoplus_\omega \mathbb{R}$ have only finitely many non-trivial terms. Conversely, this example shows that the direct product $\mathbb{R}^\omega$ is not the categorical sum. In the case of the direct product, $i$ is not well-defined. This can be seen by substituting $(1, 1, 1, \dots)$ into $i$.
For groups, the operations corresponding to categorical products and categorical sums differ slightly depending on whether we consider the general category of groups or the category of abelian groups. I shall leave this as a brief note.
| Algebraic Definition | Categorical Definition | |
|---|---|---|
| Free Product | Set of formal words + concatenation operation | Sum in $\mathbf{Grp}$ |
| Direct Sum | Set of tuples with finitely many non-trivial terms + term-wise operation | Sum in $\mathbf{Ab}$ |
| Direct Product | Set of tuples + term-wise operation | Product in $\mathbf{Grp}$ |
| 이름 | 함의 | 공리 |
|---|---|---|
| K | 가능세계에 대한 크립키 모델 | $\Box(p \to q) \to (\Box p \to \Box q)$ |
| T | 반사성 | K + $\Box p \to p$ |
| S4 | 반사성 + 추이성 | T + $\Box p \to \Box \Box p$ |
| S4.2 | 반사성 + 추이성 + R-수렴성 | S4 + $\Diamond \Box p \to \Box \Diamond p$ |
| S4.3 | 반사성 + 추이성 + R-선형성 | S4 + $(\Diamond p \land \Diamond q) \to$ $(\Diamond (p \land \Diamond q) \lor \Diamond(\Diamond p \land q))$ |
| S5 | 반사성 + 추이성 + 대칭성 | S4 + $(p \to \Box \Diamond p)$ |
표의 밑으로 갈수록 논리는 엄격히 강해진다.
정리. S4에서 양상 연산자의 나열은 6개의 조합 중 하나와 동등하며, 각 조합의 함의 관계는 다음과 같다.
정리. S5에서 양상 연산자의 나열은 $\Box$ 또는 $\Diamond$와 동등하다. 나아가 모든 논리식은 평평한flat 논리식 — 즉, 양상 연산자 안에 양상 연산자가 있는 경우가 없는 논리식과 동치이다.
정리. K는 완전하다.
증명.
린덴바움 보조정리. 임의의 무모순적인 이론은 극대적으로 무모순적인maximally consistent 이론으로 확장될 수 있다.
완전성 진술은 “무모순적인 이론은 만족 가능하다”와 동치이며, 여기에 린덴바움 보조정리를 적용하면 이는 “극대적으로 무모순적인 이론은 만족 가능하다”와 동치이다.
$u, v$가 극대적으로 무모순적인 이론이라고 하자. $\Box p \in u \implies p \in v$일 때 $u \lhd v$라고 적자. 다음을 어렵지 않게 보일 수 있다.
이로부터 극대적으로 무모순적인 이론 $u$에 대해, 표준적canonical 크립키 모델 $\mathfrak{K} = (U, \prec, V)$를 다음과 같이 정의할 수 있다.
$\mathfrak{K}$가 $u$를 만족함을 어렵지 않게 보일 수 있다. ■
This post was originally written in Korean, and has been machine translated into English. It may contain minor errors or unnatural expressions. Proofreading will be done in the near future.
| Name | Entailment | Axioms |
|---|---|---|
| K | Kripke model for possible worlds | $\Box(p \to q) \to (\Box p \to \Box q)$ |
| T | Reflexivity | K + $\Box p \to p$ |
| S4 | Reflexivity + Transitivity | T + $\Box p \to \Box \Box p$ |
| S4.2 | Reflexivity + Transitivity + R-convergence | S4 + $\Diamond \Box p \to \Box \Diamond p$ |
| S4.3 | Reflexivity + Transitivity + R-linearity | S4 + $(\Diamond p \land \Diamond q) \to$ $(\Diamond (p \land \Diamond q) \lor \Diamond(\Diamond p \land q))$ |
| S5 | Reflexivity + Transitivity + Symmetry | S4 + $(p \to \Box \Diamond p)$ |
The logics become strictly stronger as one moves down the table.
Theorem. In S4, any sequence of modal operators is equivalent to one of six combinations, and the entailment relations amongst these combinations are as follows:
Theorem. In S5, any sequence of modal operators is equivalent to either $\Box$ or $\Diamond$. Furthermore, every formula is equivalent to a flat formula—that is, a formula containing no modal operators within the scope of other modal operators.
Theorem. K is complete.
Proof.
Lindenbaum’s Lemma. Any consistent theory can be extended to a maximally consistent theory.
The completeness statement is equivalent to “every consistent theory is satisfiable”, and applying Lindenbaum’s lemma, this is equivalent to “every maximally consistent theory is satisfiable”.
Let $u, v$ be maximally consistent theories. We write $u \lhd v$ when $\Box p \in u \implies p \in v$. The following can be shown without difficulty:
From this, for a maximally consistent theory $u$, we can define the canonical Kripke model $\mathfrak{K} = (U, \prec, V)$ as follows:
It can be shown without difficulty that $\mathfrak{K}$ satisfies $u$. ■
Notation.
- $-$는 매개변수의 자릿값이다. $-$가 두 개 쓰였으면 매개변수가 두 개라는 뜻이다. 어느 매개변수가 어느 자리에 해당하는지는 맥락으로 파악한다.
- $\bullet$은 $-$를 우선하는 매개변수이다. 따라서 $\hom(-, \bullet)$은 $A$를 함자 $\hom(-, A)$에 대응시키는 함자이다.
- 함자 $F, G$에 대해 $[F, G]$를 $F$에서 $G$로 가는 자연적 변환natural transformation들의 모임으로 정의한다.
- 모든 범주는 국소적으로 작은locally small 범주라고 가정한다.
요네다 보조정리Yoneda lemma는 표현가능함자representable가 다른 함자를 바라볼 때 보이는 것이 무엇인지를 알려주는 정리이다.
예를 들어 $A \in \mathcal{A}$에 대해, 표현가능함자 $\hom_{\mathcal{A}}(-, A)$를 생각하자. 이 함자가 속하는 범주는 $[\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$이다. 따라서 $\hom_{\mathcal{A}}(-, A)$가 함자 $F : \mathcal{A}^{\mathrm{op}} \to \mathbf{Set}$를 바라볼 때 보이는 것은 다음 자연적 변환들의 집합이다.
\[[\hom_{\mathcal{A}}(-, A), F]\]위 집합은 $A \in \mathcal{A}$와 $F \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$으로부터 정의된 집합이다. 그런데 $A, F$로부터 집합을 정의할 수 있는 또다른 자연스러운 방식이 있다. 단순히 $F$에 $A$를 취하는 것이다.
\[F(A)\]요네다 보조정리에 따르면 두 집합은 동형isomorphic이다. 게다가 그냥 동형인 것이 아니라, $A \in \mathcal{A}$와 $F \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$에서 자연스럽게 동형naturally isomorphic이다. 요컨대 다음 두 함자가 $[\mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}], \mathbf{Set}]$에서 동형이다.
\[\begin{aligned} \text{(i)} \quad \mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] &\xrightarrow{\hspace{0.15cm} \hom_{\mathcal{A}}(-, \cdot)^{\mathrm{op}} \times 1 \hspace{0.15cm}} [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] \\ &\xrightarrow{\hom_{[\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]}(-, -)} \mathbf{Set} \\\\ \text{(ii)} \quad \mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] &\xrightarrow{-(-)} \mathbf{Set} \end{aligned}\]Remark. $\hom_{\mathcal{A}}(-, \cdot)^{\mathrm{op}}$에 붙은 $\mathrm{op}$는 함자의 정의역을 $\mathcal{A}^\mathrm{op}$로 맞춰주기 위함이고, 실질적으로는 $\hom_{\mathcal{A}}(-, \cdot)$와 같다.
증명. 증명의 개요만 적자면, $\hat{(\;\;)} : [\hom_\mathcal{A}(-, A), F] \to F(A)$와 $\tilde{(\;\;)}: F(A) \to [\hom_\mathcal{A}(-, A), F]$를 다음과 같이 정의한다.
\[\hat{\alpha} = \alpha_A(1_A), \quad \tilde{x} = \theta\]여기서 $\theta$는 $f : A’ \to A$를 다음과 같이 사상하는 자연적 변환이다.
\[\theta_{A'}: f \mapsto F(f^{\mathrm{op}})(x)\]$\theta$를 위와 같이 정의하는 이유는 다음 가환 도식을 만족하게끔 만들기 위함이다. ($(-)$에 $1_A$를 대입해 확인해 보라.)

이제 임의의 $A \in \mathcal{A}, F : \mathcal{A}^\mathrm{op} \to \mathbf{Set}$에 대해 다음이 성립함을 보여아 한다.
이것은 $[\hom_\mathcal{A}(-, A), F] \cong F(A)$임을 보인다. 여기에 더해, 해당 동형이 자연적임을 보여아 한다. 자아아알 생각해 보면 이것은 임의의 $A, A’ \in \mathcal{A}$와 $F, G \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$와 $f: A’ \to A$와 $\alpha: F \Rightarrow G$에 대해 다음 도식이 가환임을 보이는 것과 같다.

원소 단위로 적으면,

위가 성립함은 $\theta$의 자연성으로부터 따라 나온다. ■
요네다 보조정리가 함의하는 결과 중 다음은 아주 중요하다. 필자는 이를 그냥 요네다 따름정리라고 부른다.
요네다 따름정리. $X, Y \in \mathcal{A}$라고 하자.
- $[\hom(-, X), \hom(-, Y)] \cong \hom(X, Y)$
- $X \cong Y \iff \hom(-, X) \cong \hom(-, Y)$
증명. $F = \hom(-, Y)$로 둔다. ■
요컨대 범주론에서 대상은, 그것이 받는 사상들의 집합과 다름없다. 일례로 정수 순서 범주에서 $0$은 초기 대상으로 정의할 수 있고, 더 일반적으로 $n$은 받는 사상들의 수가 $n$개인 대상으로 정의할 수 있다. 요네다 따름정리는 이처럼 대상을 그것이 다른 대상과 맺는 사상들로서 정의하는 접근이 모든(엄밀히는 국소적으로 작은) 범주에서 유효함을 보장한다. 필자는 이 접근을 관계론적 존재론이라고 부른다.
This post was originally written in Korean, and has been machine translated into English. It may contain minor errors or unnatural expressions. Proofreading will be done in the near future.
Notation.
- $-$ denotes a parameter placeholder. If two $-$ are used, it means there are two parameters. Which parameter corresponds to which position is determined by context.
- $\bullet$ is a parameter that takes precedence over $-$. Therefore, $\hom(-, \bullet)$ is a functor that maps $A$ to the functor $\hom(-, A)$.
- For functors $F, G$, we define $[F, G]$ as the collection of natural transformations from $F$ to $G$.
- We assume all categories are locally small categories.
The Yoneda lemma is a theorem that tells us what a representable functor sees when it looks at another functor.
For example, for $A \in \mathcal{A}$, consider the representable functor $\hom_{\mathcal{A}}(-, A)$. This functor belongs to the category $[\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$. Therefore, what $\hom_{\mathcal{A}}(-, A)$ sees when it looks at a functor $F : \mathcal{A}^{\mathrm{op}} \to \mathbf{Set}$ is the following set of natural transformations:
\[[\hom_{\mathcal{A}}(-, A), F]\]The above set is a set defined from $A \in \mathcal{A}$ and $F \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$. However, there is another natural way to define a set from $A, F$. Simply applying $F$ to $A$:
\[F(A)\]According to the Yoneda lemma, the two sets are isomorphic. Moreover, they are not just isomorphic, but naturally isomorphic in $A \in \mathcal{A}$ and $F \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$. In short, the following two functors are isomorphic in $[\mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}], \mathbf{Set}]$:
\[\begin{aligned} \text{(i)} \quad \mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] &\xrightarrow{\hspace{0.15cm} \hom_{\mathcal{A}}(-, \cdot)^{\mathrm{op}} \times 1 \hspace{0.15cm}} [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] \\ &\xrightarrow{\hom_{[\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]}(-, -)} \mathbf{Set} \\\\ \text{(ii)} \quad \mathcal{A}^{\mathrm{op}} \times [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}] &\xrightarrow{-(-)} \mathbf{Set} \end{aligned}\]Remark. The $\mathrm{op}$ attached to $\hom_{\mathcal{A}}(-, \cdot)^{\mathrm{op}}$ is to adjust the domain of the functor to $\mathcal{A}^\mathrm{op}$, and is essentially the same as $\hom_{\mathcal{A}}(-, \cdot)$.
Proof. To outline the proof, we define $\hat{(\;\;)} : [\hom_\mathcal{A}(-, A), F] \to F(A)$ and $\tilde{(\;\;)}: F(A) \to [\hom_\mathcal{A}(-, A), F]$ as follows:
\[\hat{\alpha} = \alpha_A(1_A), \quad \tilde{x} = \theta\]where $\theta$ is a natural transformation that maps $f : A’ \to A$ as follows:
\[\theta_{A'}: f \mapsto F(f^{\mathrm{op}})(x)\]The reason for defining $\theta$ as above is to satisfy the following commutative diagram. (Verify by substituting $1_A$ for $(-)$.)

Now we must show that for any $A \in \mathcal{A}, F : \mathcal{A}^\mathrm{op} \to \mathbf{Set}$, the following holds:
This shows that $[\hom_\mathcal{A}(-, A), F] \cong F(A)$. In addition, we must show that this isomorphism is natural. Upon careful consideration, this is equivalent to showing that for any $A, A’ \in \mathcal{A}$ and $F, G \in [\mathcal{A}^{\mathrm{op}}, \mathbf{Set}]$ and $f: A’ \to A$ and $\alpha: F \Rightarrow G$, the following diagram commutes:

In terms of elements:

That the above holds follows from the naturality of $\theta$. ■
Among the results implied by the Yoneda lemma, the following is particularly important. I shall simply call this the Yoneda corollary.
Yoneda Corollary. Let $X, Y \in \mathcal{A}$.
- $[\hom(-, X), \hom(-, Y)] \cong \hom(X, Y)$
- $X \cong Y \iff \hom(-, X) \cong \hom(-, Y)$
Proof. Let $F = \hom(-, Y)$. ■
In essence, in category theory, an object is nothing more than the collection of morphisms it receives. For instance, in the integer order category, $0$ can be defined as the initial object, and more generally, $n$ can be defined as the object that receives $n$ morphisms. The Yoneda corollary guarantees that this approach of defining objects through the morphisms they form with other objects is valid in all (strictly speaking, locally small) categories. I call this approach relational ontology.
이 글은 David Kaplan, Quantifying In (1968)을 정리한 것이다.
다음 두 문장을 보자.
(1)과 (2)에서 모두 ‘둘’이 나타나지만, 매우 다른 방식으로 나타난다. (1)에서 ‘둘’이 나타나는 방식을 평범한 발생vulgar occurence이라고 하고, (2)에서 ‘둘’이 나타나는 방식을 우연적 발생accidental occurence이라고 하자.
단어가 평범하게 발생할 경우 해당 단어는 지시하며, 동일성에 대한 라이프니츠 원리를 만족한다(예컨데 ‘둘’을 ‘화성의 위성 개수’로 대치해도 문장의 진릿값이 보존된다). 단어가 우연적으로 발생할 경우 해당 단어는 지시하지 않으며, 라이프니츠 원리를 만족하지 않는다.
이제 다음의 문장들을 보자.
(3), (4), (5)에서 ‘둘’은 지시를 하는 것으로 보인다. 그러나 ‘둘’을 ‘화성의 위성 개수’로 바꾸면 문장의 진릿값이 보존되지 않는 것으로 보인다. 이것을 모호한 발생intermediate occurence이라고 하자.
언어철학에서 모호한 발생은 크게 두 가지 방식으로 설명된다. 첫째는 모호한 발생을 우연적 발생에 동화하는 것이고, 둘째는 모호한 발생을 평범한 발생에 동화하는 것이다.
콰인은 모호한 발생을 우연적 발생에 동화한다. 그는 (3)에서 따옴표로 감싸진 문장은 하나의 단어이고, (5)에서 둘이 하나보다 크다고 믿었다 는 원자 술어라고 주장한다. 특히 (3), (4), (5)에서 ‘둘’이 나타나는 문맥을 불투명 문맥opaque context이라고 명명한 것은 그가 모호한 발생과 우연적 발생의 동일시를 염두에 뒀음을 시사한다.
콰인은 (3), (4), (5)와, 다음의 (6), (7), (8)을 대조한다.
(3), (4), (5)와 달리 (6), (7), (8)의 문형에서 ‘둘’은 평범하게 발생하는 것으로 보인다 (콰인이라면 ‘하나’는 여전히 우연적으로 발생한다고 주장할 것이다). 그러나 (6), (7), (8)은 고전 논리로 표현할 수 있는 문장이 아니다. 고전 논리는 ‘There exists $x$ such that…‘이라는 문형은 허용하지만 ‘$n$ is such that…‘이라는 표현은 결여하기 때문이다. 따라서 (6), (7), (8)의 의미론을 정당화하는 것이 과제로 남는다.
우선 (6)부터 보자. 최소한의 논리적 분석으로도 (6)이 적형식well-formed formula이 아님을 알 수 있다. 주어의 둘 은 이름의 사용use에 해당하지만, 뒤에 ‘하나보다 크다’를 적기 는 이름의 언급mention에 해당하기 때문이다. 따라서 (6)은 의미론적으로 정당하지 않다.
(7)의 의미는 아리스토텔레스적 본질주의Aristotelian essentialism로써 설명할 수 있다. 이 설명은 임의의 대상에 대해, 그에게 본질적인 속성과 우연적인 속성이 무엇인지를 규정한다. 콰인은 이같은 방식으로 (7)의 정당성을 설명한 바 있다.
(8)이 의미론적으로 정당함을 시사하는 예시는 많이 있다. 러셀의 다음 유명한 문장을 보자.
위 문장은 직관적으로 이해가 되며, 참인 듯하다. 이것은 (8)의 의미론적 정당성을 지지한다. 또한 콰인은 다음의 유명한 문장의 쌍을 거론한다.
a. 랄프는 누군가가 스파이라고 믿는다. Ralph believes that someone is a spy.
b. 누군가에 대해, 랄프는 그가 스파이라고 믿는다. Someone is such that Ralph believes they are a spy.
a에서는 존재 양화가 믿음 문맥 안에서, b에서는 밖에서 이루어진다. 한편 콰인은 믿음 문맥 속의 단어들을 우연적 발생과 동일시하기 때문에, 그에 따르면
로부터 $\exists$-첨가를 적용하여 b를 유도할 수 없음에 유의하라. 그러나,
로부터 b를 유도하는 것은 가능하다.
결론적으로 애매한 발생에 대한 콰인의 입장은 두 가지이다. 첫째, 애매한 발생은 우연적 발생과 동일시할 수 있다. 둘째, 불투명 문맥 안과 밖에서 단어가 등장하는 경우를 구분해야 할 필요가 있을 때는 ‘…에 대해such that’ 구문을 사용할 수 있다. 콰인은 이 구문을 관계론적 의미에서의 믿음relational sense of belief이라고 부른다. 마찬가지로 우리는 관계론적 의미에서의 양상, 주장, 생각 등의 구문을 도입할 수 있겠으나, 각 구문의 도입은 별도의 정당화를 요구한다.
프레게는 모호한 발생을 평범한 발생에 동화한다. 프레게는 모호한 발생에서 라이프니츠 원리가 어긋나는 것으로 보이는 이유는, 해당 문맥에서 단어들의 실제 지시체를 우리가 혼동하기 때문이라고 주장한다. 이 혼동에는 두 가지 원인이 있다. 첫째는 지시 표현이 언제나 동일한 대상을 지시한다는 믿음이다. 이로부터 도출되는 둘째 믿음은, 대부분의 맥락에서 같은 대상을 지시하는 지시 표현은 언제나 같은 대상을 지시한다는 믿음이다.
그러나 지시 표현이 언제나 같은 대상을 지시한다는 믿음에 반하는 사례는 많다. 일례로 다음과 같이 중의적이거나 모호한ambiguous 단어의 사례가 있다.
(11)에 대한 자연스러운 분석은, 전자의 ‘F.D.R.’은 정치인을 지칭하는 한편 후자의 ‘F.D.R.’은 텔레비전 방송을 지칭한다고 보는 것이다. 이 경우 두 ‘F.D.R.’은 모두 평범한 발생이다. 그러나 극단적인 이름-지시체-일대일-대응-주의자라면 (11)이 ‘텔레비전에 딱 한 번 방영되었다’가 불투명 문맥임을 드러내며, 후자의 ‘F.D.R.’은 우연적 발생이라고 주장할지 모른다. 이 입장을 조금 더 그럴듯하게 포장하면, (11)은 올바르지 않은 문장이며 후자의 ‘F.D.R.’은 ‘‘F.D.R’이라는 이름의 텔레비전 방송’으로 수정되어야 한다고 주장할 수 있다.
이 사례가 보여주는 것은, 누군가 불투명 문맥으로 이해할 문장을 누군가는 모호함의 발생으로 이해할 수 있다는 것이다. 프레게는 지시 표현은 보통 그 일상적인 지시체를 지시하지만, 뜻sense 따위의 중간 대상을 지시할 수도 있으며, 이같은 모호함이 철학자들을 애매한 발생의 문제로 빠뜨린 원인이라고 주장한다. 프레게는 전자를 직접 지시direct reference, 후자를 간접 지시indirect reference라고 부른다.
| 콰인 | 프레게 | |
|---|---|---|
| 둘은 하나보다 크다 | 지시 문맥 | 직접 지시 |
| 필연적으로, 둘은 하나보다 크다 | 불투명 문맥 | 간접 지시 |
그렇다면 애매한 발생에서 표현의 지시체가 무엇인지 어떻게 알아낼 수 있을까? 저자는 합성의 원리principle of compositionality가 핵심이라고 말한다. 문장을 이루는 개별 요소의 지칭체가 불분명하다면, 문장 전체의 지칭체를 먼저 확인하고, 문장의 지칭체가 어떻게 분석 가능한지를 파악함으로써 개별 요소의 지칭체를 역추적할 수 있다는 것이다.
이 방법론에 따라 프레게는 인용구 안의 표현expression들은 자기 자신을 지시한다는 입장에 도달했다. 예를 들어 $\ulcorner 1 + 2 = 3 \urcorner$에서 $\ulcorner 1 \urcorner$의 지시체는 $\ulcorner 1 \urcorner$이다. 이같은 프레게의 입장은 인용 문맥 내의 양화사 사용을 가능하게 만든다. 로마 문자의 정의역이 대상이고, 그리스 문자의 정의역이 표현이라고 하면 프레게의 이론 하에서 우리는 다음과 같은 참을 표현할 수 있다.
표현에 비해 뜻sense 또는 의미meaning의 존재론적 위상은 불분명하지만, 비슷한 접근을 시도해 볼 수 있다. 먼저 다음의 사례로 예증되는 의미 따옴표를 도입하자.
고딕 문자의 정의역이 의미라고 하면 프레게주의는 다음과 같은 참을 표현할 수 있다.
Remark. 작은따옴표는 표현을 나타내는 반면, $\ulcorner$…$\urcorner$은 표현들의 합성을 의미한다. 마찬가지로 m…m은 의미를 나타내는 반면, M…M은 의미들의 합성을 의미한다. 물론 표현들의 합성도 표현이고, 의미들의 합성도 의미이기 때문에, 등식 1, 2가 성립한다. 저자가 등식 1, 2를 등식 3에 빗대어 설명했다는 사실을 떠올리면 도움이 된다.
- ‘The cat is on the mat’ $=$ $\ulcorner$The cat is on the mat$\urcorner$
- mThe cat is on the matm $=$ MThe cat is on the matM
- $237 = 2 \times 10^2 + 3 \times 10 + 7$
그러나 작은따옴표와 $\ulcorner$…$\urcorner$가 완전히 같고, 그리고 m…m과 M…M이 완전히 같은 것은 결코 아니다. 각 경우 전자는 불투명하지만 후자는 투명하기 때문이다. 따라서 1은 불가능하지만 2는 가능하다. 이것은 3은 말이 안 되지만 4는 올바른 것과 같은 이치이다.
- $\exists \alpha\; \big($ ‘$\alpha$ is on the mat’ is true$\big)$
- $\exists \alpha\; \big(\ulcorner \alpha$ is on the mat$\urcorner$ is true$\big)$
- $\exists n\; (237 < 2n7)$
- $\exists n\; (237 < 2 \times 10^2 + n \times 10 + 7)$
이제 프레게주의가 (6), (7), (8)을 어떻게 설명하는지 보자.
그에 앞서, (4), (5), (7), (8)에서 믿음의 대상이 되는 것이 정확히 무엇인지를 명료화하는 것이 도움이 된다. S가 문장일 때, 누군가가 S를 믿는다는 것, 또는 S가 필연적이라는 것은 어떻게 형식화할 수 있는가? 본 논문에서는 간단한 길을 택하여, 문장은 자기 자신을 지시하는 것으로 간주하고, 필연을 문장에 대한 단항 술어로, 믿음을 주체와 문장 사이의 이항 술어로 간주한다. 따라서 (4), (5)는 다음과 같이 적을 수 있다.
(7), (8)을 콰인식으로 형식화하기 위해, 콰인의 관계론적 믿음과 관계론적 필연을 나타낼 술어 $\mathbf{Nec}$와 $\mathbf{Bel}$를 도입하자.
여기서 볼드체 문자 $\mathbf{x}$는 $\mathbf{x}$가 지시적으로서가 아닌, 오직 자리값placeholder으로서 사용되었음을 의미한다. 콰인에 따르면 $\mathbf{x}$는 불투명 문맥에 있으므로, 지시할 수 없기 때문이다.
프레게주의는 (15)와 (16)을 다음과 같이 형식한다.
상술한 Remark로 인해 동일한 술어 $\mathbf{N}, \mathbf{B}$를 사용할 수 있다.
하지만 (19)와 (20)만으로는 부족한 점이 있다. (19)와 (20)의 ‘둘’이 지시적이긴 하지만, (7)과 (8)의 ‘둘’과는 다른 대상을 지시한다. 전자는 표현을, 후자는 수를 지시하기 때문이다. 따라서 (7)과 (8), 또는 (17)과 (18)로부터 가능했을 논리적 추론이 (19)와 (20)만으로는 얻어지지 않는다. 예를 들어 (17)과 다음이 주어졌을 때,
다음을 도출할 수 있다.
그러나 (19)와 (21)은 다음을 도출하는 데 그친다.
한편 다음은 올바르지 않다. $\alpha$는 수가 아니라 표현이기 때문이다.
그러나 이 문제는 처치가 도입한 바 있는 지시 술어 $\Delta$를 도입함으로써 해결할 수 있다. $\alpha$가 $c$를 지칭할 때, 그리고 오직 그럴 때만 $\Delta(\alpha, c)$라고 하자. 그러면 프레게식으로 (22), (17), 그리고 (18)은 각각 다음과 같이 적을 수 있다.
논문의 저자는 (23), (24), (25)가 원 문장의 직관적인 의미를 포착할 뿐 아니라, 콰인과 달리 $\mathbf{Bel}, \mathbf{Nec}$ 등의 추가적인 술어를 소개하고 정의할 필요가 없다는 점을 강조한다.
콰인은 다음의 사고실험을 제시한 바 있다. 랄프는 골목에서 갈색 모자를 쓴 수상한 인물이 벤치 밑의 서류가방을 가져가는 것을 보고는 그가 스파이일 것이라고 믿는다. 한편 랄프는 그가 속한 도시의 시장을 존경하며, 그가 스파이일 리가 없다고 믿는다. 그런데 사실 수상한 사람과 시장은 동일한 인물, 올트커트 씨이다.
콰인은 이를 다음과 같이 형식화한다.
(26), (27)을 관계론적 믿음으로 표현하면,
(28)에 의해 (29), (30)은 각각 다음을 시사한다.
따라서 랄프는 다음을 믿는 것으로 보인다.
그러나 (34)는 문제적이다. 콰인은 문제의 원인이 (32), (33)으로부터 (34)를 도출하는 데 있다고 주장한다. 프레게적 형식화는 콰인의 직관이 올바름을 증명한다. 자세한 과정은 생략하지만, (26), (27), (28)은 오직 다음을 도출한다.
여기까지는 좋다. 문제는 두 번째 역설이다. (9)가 참이라고 하자. 즉, 랄프는 스파이의 존재를 믿는다. 또한 랄프는 세상에 키가 정확히 똑같은 두 사람은 존재하지 않는다고 믿으므로 (매우 합당한 믿음이다) 키가 가장 짧은 스파이가 존재하리라 믿는다. 따라서 (39)가 성립한다.
콰인식으로 ‘키가 가장 작은 스파이’를 추출exportation하면,
$\exists$-첨가에 의해,
그리고 (41)은 (10)과 내용이 같다. 따라서 (9)와 (10)이 서로를 시사하게 되는 모순이 발생한다. 논문의 저자는 이 문제가 너무 까다로운 나머지 한때 양상 및 믿음 문맥에서 양화하는 것은 불가능하다는 입장으로 기울었으나, 이를 공략할 방안이 떠올랐다는 일화를 이야기한다. 이에 대해서는 다음 글에서 소개하도록 하겠다.
This post was originally written in Korean, and has been machine translated into English. It may contain minor errors or unnatural expressions. Proofreading will be done in the near future.
This article is a summary of David Kaplan, Quantifying In (1968).
Consider the following two sentences:
Although ‘two’ appears in both (1) and (2), it occurs in very different ways. Let us call the way ‘two’ appears in (1) a vulgar occurrence, and the way ‘two’ appears in (2) an accidental occurrence.
When a word occurs vulgarly, it refers and satisfies Leibniz’s principle of identity (for instance, substituting ‘two’ with ‘the number of moons of Mars’ preserves the truth value of the sentence). When a word occurs accidentally, it does not refer and fails to satisfy Leibniz’s principle.
Now consider the following sentences:
In (3), (4), and (5), ‘two’ appears to refer. However, substituting ‘two’ with ‘the number of moons of Mars’ does not appear to preserve the truth value of the sentences. This is called an intermediate occurrence.
In philosophy of language, intermediate occurrences are explained in two main ways. The first is to assimilate intermediate occurrences to accidental occurrences, and the second is to assimilate intermediate occurrences to vulgar occurrences.
Quine assimilates intermediate occurrences to accidental occurrences. He argues that the sentence enclosed in quotation marks in (3) is a single word, and that believed that two is greater than one in (5) is an atomic predicate. In particular, Quine’s designation of the contexts in which ‘two’ appears in (3), (4), and (5) as opaque contexts suggests that he had in mind the identification of intermediate and accidental occurrences.
Quine contrasts (3), (4), and (5) with the following (6), (7), and (8):
Unlike (3), (4), and (5), in the sentence forms (6), (7), and (8), ‘two’ appears to occur vulgarly (though Quine would argue that ‘one’ still occurs accidentally). However, (6), (7), and (8) are not sentences that can be expressed in classical logic. Classical logic permits the form ‘There exists $x$ such that…’, but lacks the expression ‘$n$ is such that…’. Therefore, the task remains to justify the semantics of (6), (7), and (8).
Let us first consider (6). Even with minimal logical analysis, we can see that (6) is not a well-formed formula. The subject two corresponds to the use of a name, while writing it after ‘is greater than one’ corresponds to the mention of a name. Therefore, (6) is not semantically justified.
The meaning of (7) can be explained by Aristotelian essentialism. This explanation specifies, for any object, what properties are essential and what properties are accidental to it. Quine has explained the justification of (7) in this manner.
There are many examples suggesting that (8) is semantically justified. Consider Russell’s famous sentence:
This sentence is intuitively comprehensible and appears to be true. This supports the semantic justification of (8). Quine also mentions the following famous pair of sentences:
a. Ralph believes that someone is a spy.
b. Someone is such that Ralph believes they are a spy.
In (a), existential quantification occurs within the belief context, while in (b) it occurs outside. Since Quine identifies words in belief contexts with accidental occurrences, according to him, note that (b) cannot be derived from
by applying $\exists$-addition. However, it is possible to derive (b) from
In conclusion, Quine’s position on intermediate occurrences is twofold. First, intermediate occurrences can be identified with accidental occurrences. Second, when it is necessary to distinguish between cases where words appear inside and outside opaque contexts, the ‘such that’ construction can be used. Quine calls this construction belief in the relational sense. Similarly, we could introduce constructions of modality, assertion, thought, etc., in the relational sense, but the introduction of each construction requires separate justification.
Frege assimilates intermediate occurrences to vulgar occurrences. Frege argues that the reason Leibniz’s principle appears to fail in intermediate occurrences is that we confuse the actual referents of words in those contexts. This confusion has two causes. The first is the belief that referring expressions always refer to the same object. The second belief, derived from this, is that referring expressions that refer to the same object in most contexts always refer to the same object.
However, there are many cases that contradict the belief that referring expressions always refer to the same object. For instance, there are cases of ambiguous words:
A natural analysis of (11) is that the former ‘F.D.R.’ refers to the politician while the latter ‘F.D.R.’ refers to the television programme. In this case, both instances of ‘F.D.R.’ are vulgar occurrences. However, an extreme name-referent-one-to-one-correspondence theorist might argue that (11) reveals that ‘was broadcast on television only once’ is an opaque context, and that the latter ‘F.D.R.’ is an accidental occurrence. This position could be made slightly more plausible by arguing that (11) is an incorrect sentence and that the latter ‘F.D.R.’ should be corrected to ‘the television programme named “F.D.R.”’.
What this case shows is that what someone understands as an opaque context, someone else can understand as the occurrence of ambiguity. Frege argues that referring expressions usually refer to their ordinary referents, but can also refer to intermediate objects such as senses, and that such ambiguity is what led philosophers into the problem of intermediate occurrences. Frege calls the former direct reference and the latter indirect reference.
| Quine | Frege | |
|---|---|---|
| Two is greater than one | Referential context | Direct reference |
| Necessarily, two is greater than one | Opaque context | Indirect reference |
How then can we determine what the referent of an expression is in intermediate occurrences? The author states that the principle of compositionality is key. If the referents of the individual elements that make up a sentence are unclear, we can first identify the referent of the entire sentence and then trace back the referents of the individual elements by understanding how the referent of the sentence can be analysed.
Following this methodology, Frege arrived at the position that expressions within quotations refer to themselves. For example, in $\ulcorner 1 + 2 = 3 \urcorner$, the referent of $\ulcorner 1 \urcorner$ is $\ulcorner 1 \urcorner$. This position of Frege makes it possible to use quantifiers within quotational contexts. If the domain of Roman letters is objects and the domain of Greek letters is expressions, then under Frege’s theory we can express the following truth:
Although the ontological status of senses or meanings is unclear compared to expressions, we can attempt a similar approach. First, let us introduce meaning quotation marks exemplified by the following case:
If the domain of Gothic letters is meanings, then Fregeanism can express the following truth:
Remark. Single quotation marks denote expressions, while $\ulcorner$…$\urcorner$ signifies the composition of expressions. Similarly, m…m denotes meanings, while M…M signifies the composition of meanings. Of course, the composition of expressions is also an expression, and the composition of meanings is also a meaning, so equations 1 and 2 hold. It is helpful to recall that the author explained equations 1 and 2 by analogy with equation 3.
- ‘The cat is on the mat’ $=$ $\ulcorner$The cat is on the mat$\urcorner$
- mThe cat is on the matm $=$ MThe cat is on the matM
- $237 = 2 \times 10^2 + 3 \times 10 + 7$
However, single quotation marks and $\ulcorner$…$\urcorner$ are not completely identical, nor are m…m and M…M completely identical. In each case, the former is opaque while the latter is transparent. Therefore, 1 is impossible but 2 is possible. This is analogous to how 3 is nonsensical but 4 is correct.
- $\exists \alpha\; \big($ ‘$\alpha$ is on the mat’ is true$\big)$
- $\exists \alpha\; \big(\ulcorner \alpha$ is on the mat$\urcorner$ is true$\big)$
- $\exists n\; (237 < 2n7)$
- $\exists n\; (237 < 2 \times 10^2 + n \times 10 + 7)$
Let us now see how Fregeanism explains (6), (7), and (8).
Before this, it is helpful to clarify precisely what is the object of belief in (4), (5), (7), and (8). When S is a sentence, how can we formalise that someone believes S, or that S is necessary? In this paper, we take the simple path of considering that sentences refer to themselves, and regard necessity as a unary predicate on sentences and belief as a binary predicate between subjects and sentences. Therefore, (4) and (5) can be written as follows:
To formalise (7) and (8) in Quine’s manner, let us introduce predicates $\mathbf{Nec}$ and $\mathbf{Bel}$ to represent Quine’s relational belief and relational necessity.
Here, the bold letter $\mathbf{x}$ signifies that $\mathbf{x}$ is used not referentially but solely as a placeholder. According to Quine, $\mathbf{x}$ is in an opaque context and therefore cannot refer.
Fregeanism formalises (15) and (16) as follows:
Due to the aforementioned Remark, we can use the same predicates $\mathbf{N}, \mathbf{B}$.
However, (19) and (20) alone are insufficient. Although ‘two’ in (19) and (20) is referential, it refers to a different object from ‘two’ in (7) and (8). The former refers to an expression, while the latter refers to a number. Therefore, logical inferences that were possible from (7) and (8), or (17) and (18), cannot be obtained from (19) and (20) alone. For example, when (17) and the following are given:
we can derive the following:
However, (19) and (21) only derive the following:
Moreover, the following is incorrect because $\alpha$ is an expression, not a number:
However, this problem can be solved by introducing the denotation predicate $\Delta$ that Church introduced. Let $\Delta(\alpha, c)$ when and only when $\alpha$ denotes $c$. Then under Frege’s theory, (22), (17), and (18) can be written as follows respectively:
The author of the paper emphasises that (23), (24), and (25) not only capture the intuitive meaning of the original sentences but also, unlike Quine, do not require the introduction and definition of additional predicates such as $\mathbf{Bel}$ and $\mathbf{Nec}$.
Quine presented the following thought experiment. Ralph sees a suspicious figure in a brown hat taking a briefcase from under a bench in an alley and believes that he is a spy. Meanwhile, Ralph respects the mayor of his city and believes that he could not possibly be a spy. However, the suspicious person and the mayor are actually the same individual, Mr Ortcutt.
Quine formalises this as follows:
Expressing (26) and (27) as relational beliefs:
By (28), (29) and (30) respectively suggest the following:
Therefore, Ralph appears to believe the following:
However, (34) is problematic. Quine argues that the problem lies in deriving (34) from (32) and (33). Fregean formalisation proves that Quine’s intuition is correct. Although the detailed process is omitted, (26), (27), and (28) only derive the following:
This is fine so far. The problem is the second paradox. Suppose (9) is true, i.e., Ralph believes in the existence of spies. Also, since Ralph believes that there are no two people in the world with exactly the same height (a very reasonable belief), he believes that there exists a shortest spy. Therefore, (39) holds:
Exporting ‘the shortest spy’ in Quine’s manner:
By $\exists$-addition:
And (41) has the same content as (10). Therefore, a contradiction arises where (9) and (10) imply each other. The author of the paper relates that this problem was so intractable that he once leaned towards the position that quantifying in modal and belief contexts is impossible, but that a way to tackle this occurred to him. This will be introduced in the next article.
이 글은 Scott Soames, What is a Theory of Truth? (1984)을 정리한 것이다.
필드는 양상 반박을 통해 타르스키의 참 정의가 참의 의미를 해명하지 못한다고 주장했다. 이에 필드는 인과 이론으로부터 참을 정의하려는 기획을 세웠다. 그러나 본 논문에서는 필드의 기획 또한 양상 반박에 직면하기 때문에 실패한다고 주장한다. 대신 논문의 저자는 타르스키의 참 정의가 각 언어별로 참이 무엇인지를 해명할 수 있도록 하는 언어의 재정의를 제안한다.
타르스키의 참 이론의 철학적 의의는, 의심의 여지가 없는 그 수학적 의의와는 다르게, 꾸준한 논쟁의 대상이다. 논쟁이 지속되는 이유 중 하나는 참에 대한 이론theory of truth의 목적이 무엇인지에 관해 학자마다 의견이 다르기 때문이다. 주요 의견은 다음과 같다.
1을 시도하는 이론은 ‘처치의 정리는 참이다’, ‘요한복음 1장 14절은 참이다’와 같이 참 술어가 문장이 아닌 명제에 적용되는 경우를 고려해야 한다. 타르스키의 참 이론은 오로지 형식적 문장에만 적용되므로, 1에 해당하지 않는다.
또한 그의 이론은 3에도 해당하지 않는다. 타르스키는 자신의 참 이론이 인식론과는 완전히 무관하다는 입장을 다음과 같이 밝혔다.
참에 대한 의미론적 정의는 “눈은 희다”라는 문장이 어떤 조건에서 승인되는지에 관해서는 아무 제약도 가하지 않는다. 그것은 오직, “눈은 희다”라는 문장을 승인하거나 거부할 때, 마찬가지로 “‘눈은 희다’는 참이다”를 승인하거나 거부해야 한다는 제약만을 가한다. 따라서 우리는 참에 대한 의미론적 정의를, 기존의 인식론적 태도에 어떠한 수정 없이 받아들일 수 있다. 우리는 소박한 실재론자로 남을 수도 있고, 비판적 실재론자, 관념론자, 경험론자, 형이상학자로도 남아 있을 수 있다.
그럼에도 타르스키의 참 술어는, 콰인이 의미론적 상승semantic ascent이라고 부른 기작을 통해 철학적 입장의 명제화에 도움을 줄 수 있다. 예를 들어 다음 형태의 추론들을 일반화하고 싶다고 하자.
자연스러운 일반화는 다음과 같다.
이 형식화에서 참 술어는 나열한 각 사례를 일반화하는 데 불가피하다. 이에 대해 혹자는 다음과 같이 참 술어에 대한 의존을 없앨 수 있다고 반문할 수 있다.
그러나 위 문장은 형태론적으로 올바르지 않다. 철학적 문제가 산재해 있는 2차 논리에 의존할 것이 아니라면, $p, q$는 명제가 아니라 문장이어야 하기 때문이다. 여기서 말하는 문장이란 수리논리적인 의미에서의 문장, 즉 자유변수가 없는 명제가 아니라, 철학적인 의미에서의 문장, 즉 기호들의 나열이다. 굳이 수리논리학의 언어를 쓰자면 $p, q$는 문장의 괴델 수이다. 요컨대 1이 아니라 2라는 것이다.
그런데 $\to$는 논리 연산자이므로, 양항에 문장이 아닌 명제가 와야 한다(수리논리학의 언어로는, 괴델 수가 아닌 문장이 와야 한다). 따라서 $p$를, $p$는 참이다 라는 명제로 만들어 줘야 한다. 형식적으로 쓰자면 다음과 같다.
이같은 의미론적 상승 덕분에 몇몇 철학적 입장을 명제화할 수 있다. 예를 들어 실재론은 다음과 같이 정리할 수 있다.
어떤 문장 $s$가 존재하여 $s$는 참이지만, 인간의 인식으로는 $s$에 대한 충분한 근거를 찾는 것이 불가능하다.
이처럼 참 술어가 철학적 입장의 명제화에 자주 등장하기 때문에 일부 철학자는 ‘참’이 철학적으로 심오한 개념이라고 믿었지만, 이미 타르스키와 콰인이 지적했듯이 이것은 순전히 표현의 편의를 위한 사용에 지나지 않으며, 참에 대한 정의 자체는 여타 철학적 입장과 무관하다.
타르스키의 참 이론은 2에 해당하며, 여기에는 그의 철학적 배경이 작용했다. 타르스키는 검소한 물리주의자moderate physicalist였다. ‘검소한’의 의미는 그가 환원의 종착지를 물리학뿐 아니라 논리학과 집합론까지 포함하는 것으로 이해했다는 것이다. 그는 자신의 물리주의와 호환 가능한 참의 정의를 원했으며, 때문에 참을 선험적 개념으로 인정하고 그 특징에 관한 공리를 나열하는 방식을 거부했다. 대신 그는 어떤 집합을 귀납적으로 정의한 다음에, ① 해당 집합을 진리집합으로 가지는 술어가 T-스키마를 모두 함의한다는 사실과, ② 해당 귀납적 정의를 만족하는 집합이 유일함을 보임으로써 참을 집합론으로 환원했다.
현대에 이르러 타르스키의 참 이론은 철학적 비판의 대상이 되었다. 본 논문의 저자는 이것이 부당한 비판이라고 주장한다. 비판의 주된 골자는 그의 이론이 참에 대한 이론이 응당 갖춰야 할 조건을 갖추지 못했다는 것인데, 이 조건들이 사실은 부당하거나 비정합적이기 때문이다.
필드는 타르스키의 참 정의를 두 단계로 구분한다. 첫째는 원시적 지칭primitive denotation이다. 이 단계에서는 언어 $L$에서 이름 $n$이 대상 $o$를 지칭한다는 것과, 술어 $P$가 대상 $o$에 대해 성립한다는 것이 무엇인지 정의한다. 이 정의는 다음과 같이 이루어져 있다.
두 번째 단계는 참에 대한 재귀적 정의이다. 이 정의는 다음과 같다.
여기서 $K$는 다음을 만족하는 유일한 집합이다.
필드는 원시적 지칭은 ‘$n$이 $o$를 지칭한다’의 의미를 해명하지 못한다고 주장한다. 필드에 따르면 지칭 관계는 언어 사용자들의 심리에 의존적이다. 따라서 ‘apple’이 사과가 아닌 바나나를 지칭하는 경우가 가능했다. 그러나 타르스키의 원시적 지칭에서는 $n$이 $o$를 지칭하는 필요충분조건 안에 ‘apple’이 사과와 결부되어 있으므로 ‘apple’이 사과를 지칭하는 것은 필연적이다. 요컨대 지칭의 정의가 하드코딩되어 있다는 점이 문제이다.
따라서 필드는 지칭에 대한 물리주의적 환원을 제시함으로써 타르스키의 한계를 극복하고자 한다. 필드의 기획은 크립키의 이론을 토대로 지칭에 대한 물리-인과적 이론을 제시함으로써, 임의의 화자의 언어 $L$에 대해 올바른 참의 정의를 도출하는 이론을 제시하는 것이다.
그러나 필드의 기획에는 문제가 있다. 첫 번째 문제는 인과적 효력을 지니지 않는 것으로 보이는 추상적 대상의 지칭이 제기하는 문제이다.
그러나 그보다 심각한 두 번째 문제는, 필드의 반박대로라면 원시적 지칭이 지칭에 대한 의미를 해명하지 않을 뿐 아니라, 참에 대한 재귀적 정의 또한 참에 대한 의미를 해명하지 않는다는 점이다. 왜냐하면 참에 대한 재귀적 정의에는 논리 연산자와 관련된 규칙이 하드코딩되어 있기 때문이다. 따라서 양상 반박이 동일하게 유효하다. 일례로 $\lor$이 논리합을 의미하는 것은 분명 우연적이지만, 재귀적 정의에 따르면 “$T(\ulcorner A \lor B \urcorner) \Leftrightarrow T(\ulcorner A \urcorner)$ 또는 $T(\ulcorner B \urcorner)$”는 필연적이다.
따라서 필드는 1과 2뿐 아니라 3, 4, 5, …에 대한 물리주의적 환원 또한 제시해야 한다.
그러나 어떻게 3, 4, 5, …를 참에 대한 순환적 의존 없이 환원할 수 있는가는 불분명하다. 논문의 저자는 지금까지 이루어진 이 작업에 대한 시도가 성공적이지 못했다고 주장한다. 그 예시로 콰인이 진릿값 연산자를 언어 공동체의 집단적 승인 또는 거부로 환원하려고 했던 시도를 거론하는데, 이것이 문제적인 이유는 Alan Berger, Quine on ‘Alternative Logics’ and Verdict Tables (1980)을 참고하라고 한다. (난 아직 안 읽어봤는데 아마 양상 문제일듯)
덤. Burgess는 Truth에서 필드의 기획이 크립키의 이론에 의존하는 것 또한 문제적이라고 지적한다. 크립키의 이론은 지시에 대한 이론이 아니기 때문이다. 크립키의 이론은 이름 $n$을 사용하여 대상 $o$를 지시하는 최초의 행위가 어떻게 이어짐으로써 이름의 의미론을 형성하는지에 대한 이론으로, 그의 이론에서 지시는 선험적 개념이다. 크립키 본인도 자신의 이론이 지시에 대한 환원주의라는 세간의 의견에 강하게 반발했다.
대부분의 언어철학자는 의미와 참이 상호 시사적인 관계에 있음을 인정한다. 일례로 다음을 인정한다.
따라서 일부 철학자들은 타르스키의 참 이론이 의미에 대한 이론으로 확장될 수 있으리라 기대했다. 그러나 양상 반박은 타르스키의 참 이론이 의미에 대한 이론으로 연결될 수 없음 또한 보여준다. 예컨데 페아노 산술에 대해 정의한 타르스키의 참 술어는 1을 시사하지만 2를 시사하지는 않기 때문이다. 오히려 타르스키의 정의는 3을 시사한다.
물론 타르스키는 참에 대한 정의가 실질적으로 적합materially adequate할 것을 요구하기 때문에, $\dot{+}$의 의미가 실제로 곱셈이었다면 $T(\ulcorner 1 \;\dot{+}\; 1 = 2 \urcorner) \Leftrightarrow 1 + 1 = 2$를 시사하는 $T$는 올바른 참의 정의가 아니라고 주장할 것이다. 즉, 타르스키는 다음을 주장한다. ($\square p$는 $p$가 필연적이라는 의미이다)
a. $\square($ $T$가 참 술어이다 $\to$ ( 문장 $S$의 의미가 $\phi$이다 $\to$ $\;T(S) \Leftrightarrow \phi$이다 ) $)$
그러나 참에 대한 이론으로부터 의미에 대한 이론을 유도하려는 접근은 다음의 명제에 의존한다.
b. $T$가 참 술어이다 $\to$ $\square($ 문장 $S$의 의미가 $\phi$이다 $\to$ $\;T(S) \Leftrightarrow \phi$이다 $)$
a와 b는 다른 명제이다. 타르스키의 이론은 a를 보장하지만 b는 보장하지 않는다.
지금까지 살펴 본 타르스키의 참에 대한 비판은, 언어 $L$에서 이름이 지칭하는 대상들이 우연적이어야 함을, 즉 의미론이 $L$의 화자에 의존적임을 전제했다. 그러나 논문의 저자는 이같은 방식으로 언어를 바라보는 대신, 이름이 무엇을 지칭하는가에 대한 정보 또한 언어의 일부로 볼 것을 제안한다.
일례로 1차 논리에서 언어 $L$은 삼중쌍 $\langle S_L, D_L, F_L \rangle$로 간주할 수 있다(여기서 말하는 언어는 모델론의 언어와 사뭇 다르다. 여기서의 언어는 형태론뿐 아니라 의미론도 가지고 있다). 각각의 의미는 다음과 같다.
이와 같이 언어를 정의할 경우, 타르스키의 참 정의는 임의의 언어 $L$에 대해 실질적으로 적합한 참 술어 $T_L$을 내놓는다. 또한 $F_L$은 튜플의 집합에 불과하므로, 타르스키의 물리주의적 노선에서 벗어나지 않는다. 요컨대 논문의 저자는 언어의 의미론을 그 언어의 본질적 성질essential property로 간주함으로써 타르스키의 참 정의를 일반적인 참의 정의로 승격시킬 수 있다고 주장한다. 따라서 언어 $L$에서 이름 $n$이 그것이 지칭하는 대상 $o$가 아닌 다른 대상을 지시했을 경우는 없다. 언어 사용자 집단은 언어에 의미론을 부여하는 주체가 아니라, 어떤 언어를 사용할지 선택하는 주체이다. 그리고 집단이 사용하는 언어를 판단하는 문제는 의미론의 문제가 아닌 화용론의 문제이다.
필드의 물리주의적 배경은 그가 문장보다 발화utterance에 주목하게끔 만들었다. 필드는 타르스키가 문장에 대한 참의 정의만 제시했을 뿐, 발화에 대한 참의 정의는 제시하지 못했다고 주장한다. 만약 타르스키가 이 반박을 들었다면, 그는 이 작업이 다음과 같이 두 단계로 구분되어야 한다고 말했을 것이다.
따라서 타르스키의 정의는 유형 정의이다. 반면 필드는 다음 질문에 답하고자 한다.
여기서 토큰은 종이에 적힌 흑연 자국일 수도 있고, 칠판의 백묵 자국일 수도 있고, 음성일 수도 있다. 즉 필드가 모색하는 것은 토큰 정의이다. 그러나 참에 대한 토큰 정의가 가능하지는 의문스럽다. 필드 본인은 다음과 같이 타르스키의 정의를 변형함으로써 토큰 정의에 도달하고자 시도했다.
그러나 앞서 말했듯이 위 정의는 $\lnot$의 의미를 부정으로 하드코딩하므로, 똑같이 양상 반론에 직면한다는 문제가 있다. 따라서 위의 정의는 다음과 같이 수정되어야 한다.
하지만 설령 ‘…의 부정이다’가 물리주의적으로 환원될 수 있다고 하더라도, 주어진 맥락에서 유관한 $B$의 토큰을 어떻게 특정할 수 있는지가 불분명하다. 예를 들어 다음 예문을 보자.
기후 위기와 관련된 트럼프의 그 주장은 틀렸다.
트럼프가 기후 위기와 관련하여 한 수많은 발언 토큰들 중 무엇이 위 문장에서 부정의 대상이 되어야 하는지는 불분명하다. 심지어 $B$의 토큰은 아예 존재하지 않을 수도 있다. 예를 들어 다음 예문을 보자.
트럼프가 윤리학 강의를 진행한다면 대부분의 내용이 틀릴 것이다.
필자가 아는 한에서 트럼프는 윤리학 강의를 진행한 적이 없으므로, 위 문장에서 부정의 대상이 되는 토큰은 존재하지 않는다. 그러나 위 문장이 참이라고 주장하는 것은 충분히 합당해 보인다. 이것은 참에 대한 토큰 정의이 봉착하는 난관을 드러낸다. 이로부터 논문의 저자는 참에 대한 타르스키의 유형 정의를 일단 받아들이고, 언어, 표현, 화자, 그리고 발화 사이의 화용론적 관계가 물리주의로 환원될 수 있는지는 별개의 문제로 봐야 한다고 주장한다.
비록 논문의 저자는 언어와 화자의 관계를 화용론에 영역에 귀속시켰지만, 그렇다고 해서 이 문제가 중요하지 않은 것은 아니라고 강조한다. 언어와 화자의 관계에 대해서도 여러 철학적 고찰점이 있기 때문이다. 일례로 콰인은 “화자 $A$가 언어 $L$을 사용한다”라는 진술이 물리주의적으로 환원될 수 없다고 주장한다(가바가이 논증). 논문의 저자에 따르면 콰인의 입장은, 타르스키의 참 정의를 받아들이되 언어와 화자의 관계를 물리주의적으로 환원하는 것을 거부하는 입장으로 볼 수 있다.
마지막으로 논문의 저자는 참의 개념으로부터 의미에 대한 이론을 유도하려는 시도, 특히 참 개념의 습득이 의미론적 능력semantic competence의 전제 조건이라는 이론 일반은 모두 성공할 수 없다고 주장한다. 자세히 설명하지는 않지만, 아마 다음과 같은 문제이지 않을까 싶다. 참의 개념으로부터 의미에 대한 이론을 유도하려는 시도는 1로부터 2를 주장하고자 한다.
하지만 $\leftrightarrow$를 고전 논리의 동치 관계로 이해하든, 양상 논리의 필연적 동치 관계로 이해하든 간에 2는 성립하지 않는다. 예를 들어 다음은 필연적으로 성립한다.
그러나 $1 + 1 = 2$의 의미가 페르마의 마지막 정리인 것은 아니다.
결론적으로 논문의 저자는 참에 대한 이론이 의미에 대한 이론과 직결되어 있어야 한다는 요구는 부당하다고 주장함으로써 타르스키의 참 정의와, 그것이 함의하는 참에 대한 축소주의deflationism를 옹호한다. 이것이 참에 대한 이론이 불필요함을 의미하지는 않는다. 크립키의 참 이론은 타르스키의 참 이론을 실질적으로 발전시켰다. 그러나 그 발전은 이미 우리에게 익숙한 참의 성질들을 T-스키마로써 정확히 해명하고, 올바르게 설계된 형태론으로 거짓말쟁이 역설과 같은 모순을 회피하는 데 있다. 참에 대한 이론으로부터 이 이상을 기대하는 것은 바람직하지 않다.