Social Network Analysis

1.1 Social Network Analysis (SNA) 개론

1.1.1 정의

- 인간 관계의 '연결성'에 주목하여 사회 구조와 행위의 효과를 설명하는 방법론

- 단순히 "누가 누구를 아는가"를 넘어 "네트워크의 구조가 어떻게 개인과 집단의 성과를 결정하는가"를

통계적/수학적으로 규명하는 강력한 도구

1.1.2 표현방식 - 사람, 조직 등의 개체를 노드(Node)로 이들 사이의 관계를 선(Edge/Link)으로 표현

1.1.3 주요 이론

- 특정 네트워크 내에서 행위자가 차지하는 '위치'가 그들의 의식,

유용성, 행위에 대한 보상에 결정적인 영향을 미친다는 관점

- 예) 학급 내 친구 관계망 분석을 통해 학생들의 공통 행동 양식 파악

1.2 중앙성 (Centrality)의 개념

1.2.1 정의

- 네트워크 내에서 특정 노드가 얼마나 중요한 위치에 있는지를 나타내는 지표

1.2.2 종류

1.2.2.1 연결정도 중앙성(Degree Centrality)

- 기준 : 직접 연결된 관계 수

한 노드에 직접 연결된 이웃 노드의 수

한 노드가 얼마나 많은 인접 노드와 직접 연결되어 있는가? (권력과 영향력의 척도)

- 의미 : 얼마나 많은 사람과 연결되어 있는가 → 연결이 많을수록 활발함/인기도 높음

- 특징 : In-degree → 들어오는 연결(인기), Out-degree → 나가는 연결(활동성)

예) 친구가 많은 사람은 연결정도 중앙성이 높음

* 필요 시 최대 연결 수(N - 1)로 나누어 정규화
※ 방향성이 있는(Directed) 네트워크에서는 In과 Out을 반드시 구분해야 함

인접행렬 (행은 내가 누구에게 연결했는가 Out Degree / 열은 누가 나에게 연결했는가 In Degree)

2명에게 연결 (활발함), 1명에게 선택 (인기)

	A	B	C	D
A	0	1	1	0
B	0	0	1	0
C	1	0	0	1
D	0	0	0	0

노드	Out Degree(행)	In Degree(열)
A	2	1
B	1	1
C	2	2
D	0	1

정규화 (N - 1로 나눔) 노드가 4개면 최대 연결 가능 수 = 3 (N - 1)

A의 Out Degree = 2 → 정규화 = 2 / 3 = 0.67

- 다른 노드와의 직접 연결된 정도를 중심으로 보낸 개념

- 정규화는 전체(내향/외향) 연결 수의 합(dgree)으로 나눈 값, n - 1로 나눈 값

- 내향/외향 연결정도와 전체 합 또는 n-1로 나누는 정규화 과정

1.2.2.2 매개 중앙성(Betweenness Centrality)

- 기준 : 최단 경로 상에서의 중개 빈도

노드가 다른 노드들 사이의 경로상에 위치하여 '중개자' 역할을 하는 정도

- 의미 : 정보 흐름을 연결하는 중개자(Broker) 역할

- 특징 : 중간에서 얼마나 많이 거쳐 가는가 → 값이 클수록 통제력과 영향력 증가, 끝 노드(Pendant)는 값이 0

예) A — B — C — D 최단 경로들
[A ↔ C] A → B → C → B 포함
[A ↔ D] A → B → C → D → B, C 포함
[B ↔ D] B → C → D → C 포함

B의 매개 중앙성(B를 거치는 경우) A ↔ C, A ↔ D 2번 등장
C의 매개 중앙성(C를 거치는 경우) A ↔ D, B ↔ D 2번 등장
A, D는 중간이 아니라 끝 → 0, 중간에 끼어 있어야 값이 생김
Pendant(끝 노드, “거쳐서” 갈 수 없음 → 매개 중앙성은 0) = 연결선 1개짜리 노드
특정 노드를 거치는 비율 → 어떤 노드쌍 최단경로가 2개인데 그 중 1개만 B를 거치면 B 기여도 = 1/2 (이런 걸 전부 더함)

1.2.2.3 근접 중앙성(Closeness Centrality)

- 기준 : 다른 노드까지의 거리 (최단거리 합의 역수)

전체 네트워크의 다른 노드들에게 얼마나 빨리 도달할 수 있는지를 나타내는 척도(정보 효율성과 접근성)

- 의미 : 정보 접근 속도와 효율성

- 특징 : 다른 모든 사람과 얼마나 가까운가 → 값이 클수록 빠르게 전체에 도달 가능

예) 모든 사람에게 빠르게 연락 가능한 위치)

※ 거리가 짧을수록 값이 '커지도록' 역수(1/합)를 취함 * 값이 클수록 좋은 구조

노드	거리 합	역수(근접 중앙성)
1번 노드 B기준(B에서 다른 노드까지 거리)	B → A = 1 B → C = 1 B → D = 2 거리 합 = 1 + 1 + 2 = 4 근접 중앙성 = 1 / 4 = 0.25	0.25 큼 B가 더 중심에 있어서 더 빨리 다른 사람들에게 도달 가능 그래서 값이 더
2번 노드 A 기준(A에서 다른 노드까지 거리)	A → B = 1 A → C = 2 A → D = 3 거리 합 = 1 + 2 + 3 = 6 근접 중앙성 = 1 / 6 = 0.167	0.167 작음

1.2.2.4 고유벡터 중앙성(Eigenvector Centrality)

- 기준 : 연결된 노드의 중요도까지 반영

연결된 이웃들이 얼마나 중요한지에 가중치를 두는 방식

- 의미 : 단순 연결 수가 아닌 영향력의 질(중요도)
- 특징 : 중요한 사람과 연결되어 있는가 → 중요한 노드와 연결될 수록 값 증가

예) 유명 인플루언서와 연결된 사람은 영향력 큼

중앙성	기준	의미
연결정도 (Degree)	연결 수	인기 / 활동성
매개 (Betweenness)	경로 중간	중개 / 통제 (중개 역할)
근접 (Closeness)	거리	빠른 접근 (거리 기반 접근성)
고유벡터 (Eigenvector)	연결의 질	영향력 (연결된 노드의 중요도)

중앙성(Centrality)의 4가지 관점

네트워크에서 '중심'에 있다는 것은 권력, 영향력, 정보 우위를 의미

중앙성 종류	핵심 개념	주요 특징
연결정도 중앙성 (Degree)	직접 연결된 이웃의 수	가장 직접적인 영향력과 활동성 측정
근접 중앙성 (Closeness)	모든 노드에 도달하는 최단 거리의 합	정보 전달의 신속성, 사회적 지위 접근 용이
사이(매개) 중앙성 (Betweenness)	노드 간 최단 경로 위에 위치하는 정도	브로커(Broker) 역할, 정보 흐름 제어 및 중재
위세 중앙성 (Prestige)	연결된 상대방의 중요도(가중치) 고려	아이겐 벡터 방식, 유력한 사람과 연결될수록 상승

1) 내향(In-degree) / 외향(Out-degree) 중앙성

- 내향 > 외향 : 많은 선택을 받는 사람 (유명인, Prestige)

- 내향 < 외향 : 관계를 맺으려고 노력하는 사람 (사교가, Socialite)

중앙성 효과(Network Effect)

1) 영향력 증대 : 집단 내 의사결정에 미치는 힘이 커짐

2) 혁신과 승진 : 개인적 혁신이 용이해지며 구조적 공백을 활용할 경우 승진 기회가 확대됨

중앙성(Centrality) 4가지(Degree, Closeness, Betweenness, Prestige)의 차이점과 특징
중앙성은 노드의 중요성을 측정하는 지표로 연결정도 중앙성(Degree)은 연결 수 기반 인기/활동성, 근접 중앙성(Closeness)은 거리 기반 접근성, 매개 중앙성(Betweenness)은 경로 상의 중개 역할과 통제력, 프레스티지(Prestige)는 들어오는 연결(In-degree)을 통해 영향력을 의미

중앙성(Centrality)와 중심화(Centralization)의 차이
중앙성(Centrality)은 개별 노드(Node) 수준의 지표로 특정 노드의 중요성을 측정하고 중심화(Centralization)는 네트워크 전체 수준의 지표로 연결이나 권력이 특정 노드에 얼마나 집중되어 있는지를 나타냄
중심화가 높을수록 소수 노드에 권력이 집중된 구조임

※ Degree(인기), Betweenness(통로), Closeness(속도), Eigenvector(영향력), Centrality(개인), Centralization(전체 구조)

1.3 연결망 자료의 세가지 형태

1.3.1 분석 대상과 범위에 따라 데이터는 크게 세 가지로 분류

	모든 상호작용이 연결된 완전연결망 (Full Network, 분산형)	나를 중심으로 지인들을 펼쳐본 자아중심연결망 (Ego Network, 중앙집중형)	교류가 없어도 인위적으로 관계를 묶어 버린 준연결망 (Quasi/Affiliation Network, 탈중앙화)
개념	모든 노드가 서로 연결된 전체 네트워크 구조 * 모든 개인이 서로 빠짐없이 연결된 상태 * 완전연결망은 팀원들이 모두 서로 알고 있음	특정 개인(Ego)을 중심으로 그와 연결된 관계만 포함한 네트워크 * 중심은 나 (Ego), 주변은 내가 아는 사람들 (Alter) * 내가 가운데 있고 주변에 친구, 동료, 가족이 연결됨 (내 인맥 지도) * 나 ↔ 직장 동료, 나 ↔ 친구, 나 ↔ 가족	직접적 상호작용(대화, 연락 등)이 없어도 공동 소속(학교, 조직, 프로젝트 등)을 기준으로 관계를 추론한 네트워크 예) 구매 데이터(Amazon), 공출현(Co-occurrence) 분석 등 * 예) 같은 회사 직원 → A와 B가 서로 몰라도 같은 회사에 속해 있으면 연결로 간주 (소속 기준) * 예) 같은 학교 출신 → 서로 대화 한 번 안 했어도 같은 대학 졸업 * 예) 같은 프로젝트 참여자 → 직접 협업 안 했어도 같은 프로젝트 팀 * 직접 관계 데이터가 없을 때 대체해서 사용
구성	-	- Ego : 중심 개인 - Alter : 주변 연결된 사람들	-
특징	- 높은 밀도와 균일한 연결 분포 - 다중 경로 존재 → 높은 안정성·응집력 - 정보가 다양한 경로로 전달 → 협업에 유리 * 집단 내 모든 구성원 간의 관계를 완벽히 분석 * 경계가 명확한 집단(학급 등)에 적합 * 완전연결망은 팀원들이 모두 서로 알고 있음	- 중심 노드에 높은 중심성 집중 - 정보 흐름을 통제하는 게이트키퍼/브로커 역할 * 표본 추출 가능, 방대한 데이터 분석 시 유용	- 간접적 관계(공유 속성)를 기반으로 연결 - 중심이 분산된 탈중앙 구조 - 모든 노드의 중심성이 비교적 균등
표현방식	- Binary : 연결 여부(0/1) * 서로 아는지 여부만 체크 (전부 YES) - Valued : 관계 강도(빈도, 강도 등) * 누가 얼마나 자주 협업하는지 (사람마다 다름)	-	[생성방식] - 2-mode (사람–조직) → X×X′X \times X' → 1-mode (사람–사람)
장점	안정성, 신뢰성, 협업 효율	빠른 의사결정, 관리 효율성, 낮은 수집 비용	데이터 수집 용이, 구조적 관계 파악 가능
단점	연결 유지 비용 증가, 의사결정 속도 저하	중심 노드 의존 → 단일 실패 위험(네트워크 마비)	실제 상호작용이 아닌 추론 기반 연결

자아중심 네트워크(Ego network)가 비용 및 샘플링 측면에서 갖는 장점
특정 개인(Ego) 중심으로 일부 관계만 조사하므로 자료 수집 비용이 낮고 샘플링이 용이하다는 장점

구조적 공백을 통해 브로커가 얻는 이점을 중복성과 제약성 용어
구조적 공백에서 브로커는 중복성(Redundancy)이 낮고 제약성(Constraint)이 낮은 위치에 있어 서로 다른 집단의 정보를 독점/중개할 수 있으며 정보 접근성과 기회 확보 측면에서 유리한 위치를 가짐

구조적 공백(Structural Hole)이 왜 성과와 연결되는가
구조적 공백을 점유한 행위자는 단절된 집단 간 정보 흐름을 통제하며 다양한 정보를 효율적으로 획득할 수 있어 협상력, 혁신 기회, 성과(이윤/승진 등)가 증가함

Constraint(제약성) 값이 높을 때 구조적 공백 활용에 불리하다는 사실을 인지
제약성(Constraint)이 높을수록 관계가 특정 집단에 집중되어 네트워크의 자유도와 다양성이 감소하고 구조적 공백을 활용한 정보 획득 및 기회 창출이 어려워짐

1.3.2 준연결망(Quasi-network)의 활용 및 변형 (2 mode → 1 mode)

1) 개념

- 직접적인 관계 데이터 수집이 어려운 경우 공유 속성(클럽, 이벤트, 구매 등)을 통해 관계를 간접적으로 추론하는 방법

- 직접 연결이 없어도 구조적 유사성 및 잠재적 관계를 파악 가능

2) 네트워크 형태

- 1-mode 네트워크 → 동일한 유형 간 연결 (예, 사람-사람)

- 2-mode 네트워크 → 서론 다른 두 집단 간 연결 (예, 사람-클럽, 사람-이벤트)

- 2-mode → 1-mode 변환 : 2-mode 행렬 X와 전치행렬 X'를 이용하여 교차곱(Cross-product, X * X') 수행

* 같이 속한 횟수로 관계를 만든다.

3) 해석

- 대각선 값 → 해당 노드의 활동량 또는 연결 정도(자기 연결)

- 비대각선 값 → 두 노드 간 공유된 속성의 수(공동 소속, 유사성, 친밀도)

4) 속성 기반 거리 - 변수값들 사이의 공분산 행렬이나 Euclidean distance를 이용해 관계를 설정

1.4 SNA의 주요 응용 분야

사회연결망 분석은 다양한 학문 및 산업 분야에서 활용

1) 감염학 - 유행병(AIDS 등)의 확산 경로 연구

2) 경영/마케팅 : 소문 및 구전 효과, 추천 시스템, 금융사기(이상치) 탐지

3) 사회과학 - 비만이나 행복의 전염(확산) 현상 연구

4) 기술경영 - 기업 간 전략적 제휴, 특허(IPC) 연결망, 연구자 네트워크 분석

5) 기타 - 항공사 좌석 공유 네트워크, 온라인 게임 생태계 분석 등

1.5 네트워크 분석의 미래 (Graph Learning)

전통적인 데이터 마이닝이 개체의 '속성(Attribute)'에만 집중했다면

현대의 데이터 과학은 '연결 정보(Link)'를 함께 고려

1.5.1 Graph Deep Learning - 단순한 구조의 CNN/RNN을 넘어 복잡한 그래프 구조에 딥러닝을 적용하는 단계

1.5.2 주요 학습 과제

- Node Classification : 특정 노드의 특성 분류

- Link Prediction : 향후 연결될 가능성이 높은 관계 예측

- Community Detection : 네트워크 내의 하부 커뮤니티 탐지

2.1 연결망 사회의 출현과 구조주의

2.1.1 연결망 연구의 역사와 그래프 이론
- 사회연결망 분석은 수학적 '그래프 이론'에 그 뿌리를 두고 있음

- 단순한 분석 도구를 넘어 사회를 바라보는 '새로운 패러다임(관계론적 관점)'임을 강조

- 개인의 속성보다 그 개인이 맺고 있는 '관계의 지도'가 사회 현상을 이해하는 핵심 열쇠

1) 기원

- 1736년 오일러(Euler)의 '쾨니히스베르크의 다리 문제'

그래프 이론을 통해 특정 경로의 존재 여부를 수학적으로 증명

2) 발전

- 20세기 모레노(Moreno) : 행위자 간의 선택을 시각화한 '소시오그램(Sociogram)' 도입
- 폴 에르되시(Paul Erdös) : 무작위적으로 연결된 'Random Graph' 연구

3) 주요 고전 연구
- Milgram (1977) : 좁은 세상(Small World) 실험
- Granovetter (1977) : 약한 연결의 힘(The Strength of Weak Ties)

- Freeman (1978) : 중앙성(Centrality) 개념의 정립

2.2 연결망 사회(Network Society)의 출현

정보화와 세계화가 결합하면서 전통적인 경계가 허물어지고 네트워크가 중심이 되는 사회가 도래했음
1) 경계의 모호성 : FILA의 사례처럼 국가/민족이라는 물리적 경계보다 '연결된 가치 사슬'이 중요해짐
2) 사이버 공간의 확장 : Facebook 등 SNS를 통해 전 세계인의 일상이 재조직화됨
3) 주요 특징
- 좁은 세상(Small World) : 몇 단계만 거치면 모두가 연결됨
- 척도 없는 네트워크(Scale-Free) : 80/20 법칙처럼 소수의 노드가 대부분의 연결을 독점

(Preferential Attachment)
- 복잡계(Complex System) : 나비효과처럼 미세한 변화가 전체 체계에 예측 불가능한 영향을 미침

(창발성, Emergence)

2.3 사회연결망의 인간관

인간을 바라보는 기존의 관점(경제학과 사회학)에 새로운 대안을 제시

1) 고전 경제학적 인간 : 개인의 효용 극대화 추구 (합리적 선택)
2) 사회학적 인간 : 사회적 규범과 역할 수행 (사회화된 존재)
3) 사회연결망적 인간 : '네트워크상의 위치'에 따라 행위가 결정됨
- 열린/닫힌 연결망 사례 : 부모 간의 연결 여부가 자녀의 비행 예방에 영향을 미침(사회적 자본)
- 흥정 게임 실험 : 인간은 단순히 경제적 이익만 쫓지 않으며 관계 속에서 형성된 규범과 감성의 영향을 받음

2.4 구조주의와 연결망 분석

개인의 개별 속성(나이, 성별 등)보다 '관계적 속성'을 통해 사회 현상을 설명함

1) 구조적 효과 : 개인이 처한 네트워크의 분포와 구조가 개인의 행위를 제약하거나 촉진함
2) 자아 중심 네트워크(Ego-centric Network)
- 특정 개인(Ego)을 중심으로 한 주변인(Alters)과의 관계망
- 문화권별 차이 분석 가능 (예: 한국은 비슷한 연령대나 동성 간 고민 상담 비중이 높음)
3) 전염 모델 : 비만, 행복, 우울, 감염병 등은 네트워크를 통해 전파됨
4) 구조의 심층 분석
- 단순 관계망에 속성(Attribute) 데이터를 결합하여 심층적 분석 수행
- 변형 구조주의 : 의사-간호사-환자-제약회사의 관계처럼 역할 구조 네트워크로 확장

2.5 의미 연결망 분석(Semantic Network Analysis)

텍스트 데이터에서 단어 간의 관계를 추출하여 지식의 구조를 분석하는 기법

1) 공출현(Co-occurrence) : 한 문장이나 문단 내에 단어들이 동시에 등장하는 빈도를 측정
2) 분석 과정
① 텍스트 원문 수집 → ② 형태소 분석 및 명사 추출 → ③ 불용어(Stop words) 제거 →

④ 단어 간 관계 행렬 구축 및 시각화
3) 활용 예시 : 사회 교과서 내의 핵심 개념 구조 분석, 여론 분석 등

3.1 복잡계와 연결망의 역학

3.1.1 복잡계(Complex System)와 연결망 사회
1) 개념

- 개별 요소의 단순 합으로 설명할 수 없고 요소 간 상호작용을 통해 새로운 특성이 나타나는 시스템을 의미

- 작은 변화가 상호작용을 통해 어느 순간 크게 터지는 시스템

2) 주요 특징
- 창발성(Emergence) : 개별 요소에는 없던 특성이 전체 시스템에서 새롭게 나타남

예) 세포의 집합이 인간이라는 새로운 존재를 형성

- 자기조직화 : 중앙의 통제 없이 스스로 질서를 형성
- 초기 조건에 대한 민감성 : '나비 효과'처럼 작은 차이가 시간이 자나면서 큰 결과로 확대됨
3) 주요 효과 * 점진적 변화가 아니라 비선형적 급변
- 임계치(Critical Mass) / 문지방 효과(Threshold) : 일정 수준을 넘으면 변화가 급격히 발생

(예: 역사적 혁명, 슈퍼스타 탄생)
- 티핑 포인트(Tipping Point) : 균형을 유지되다가 특정 지점에서 급격한 변화로 전환되는 시점

(예: 백인의 교외 탈주 현상 - 흑인 비율 20% 지점)

4) 연결망과의 관계

- 사회현상은 개인이 아니라 상호작용 구조(네트워크)에서 발생

- 복잡계 특성은 네트워크를 통해 확산/증폭/변형됨

4.2 대인관계망과 복잡계

1) 복잡계 - 요소들의 단순함이 아닌 상호작용을 통해 예측 불가능한 집합적 특성이 나타나는 체계

- 창발성, 자기조직화, 초기 조건에 대한 민감성(나비효과)

예) 인간과 세포의 집합, 도시와 건물/사람/도로의 집합

복잡계의 핵심인 창발성, 나비효과, 임계치/티핑포인트의 개념
복잡계에서는 요소 간 상호작용을 통해 창발성(Emergence)이 나타나며 작은 변화가 큰 결과로 확대되는
나비효과가 발생함
또한, 변화는 점진적이기보다 일정 수준을 넘는 순간 급격히 일어나는 임계치(Threshold) 또는 티핑 포인트(Tipping Point)의 특성을 가짐

3.2 연결망의 역학 - 외부성과 크기

3.2.1 연결망 외부성(Network Externality) - 약한 연결은 새로운 정보를 가져옴

- 재화나 서비스의 가치가 사용자 수(네트워크 규모)에 따라 증가하는 현상

→ 사용자가 많을수록 가치가 커진다(임계치 이후 폭발적 성장)

- 사용자가 많을 수록 가치가 증가

- 일정 수준(임계치)을 넘으면 급격한 확산 발생

- 시장의 승자는 기술력보다 네트워크 확보 여부에 의해 결정되기도 함 예) 팩스, OS

약한 연결의 강점(Strength of Weak Ties)이 성립하는 이유
Mark Granovetter에 따르면 강한 연결은 유사한 정보가 반복되어 정보의 중복성이 높음
반면, 약한 연결은 서로 다른 집단을 이어주는 교량(Bridge) 역할을 하여 기존 네트워크에 없던 새롭고 다양한 정보를
전달함
따라서, 이직 정보나 혁신적 아이디어와 같은 가치 있는 정보 획득에 유리함

3.2.2 연결망의 크기와 던바의 수 * 인간 관계는 무한하지 않으며 약 150명을 기준으로 계층적 확장 됨
1) 던바의 수(Dunbar Number) : 인간의 인지적 한계로 인해 한 사람이 안정적으로 사회적 관계를 유지할 수 있는

최대 인원은 약 150명

2) 연결망의 계층 구조(5-15-50-150 법칙) : 사회적 관계는 친밀도의 따라 연결망이 일정한 스케일을 가짐

- 약 5명(매우 친밀한 관계), 약 15명(가까운 친구), 약 50명(일반적 사회 관계)

- 약 150명(안정적으로 유지 가능한 최대 관계 수)

3.2.3 유유상종(Homophily) : 사람은 비슷한 사람과 연결 → 효율성은 높지만 다양성은 낮아질 수 있음

1) 정의 : 학력, 지역, 관심사 등 비슷한 속성을 가진 사람들끼리 연결되는 사회적 현상

1) 특징

- 유사한 특성을 가진 집단 내에서 연결이 더 쉽게 형성됨

- 관계 형성과 유지에 필요한 비용이 낮아져 상호작용 효율성 증가

- 네트워크가 동질적인 구조로 형성되는 경향

2) 해석

- 내집단 선호(In group preference)에 의해 자연스럽게 발생

- 유사성 기반 선택으로 관계 형성의 효율성을 높임

- 동시에 집단 간 단절을 강화하여 차별 또는 불평등 구조를 심화시킬 수 있음

3.3 사회적 자본(Social Capital)

사회적 자본 = 관계에서 나오는 신뢰 → 거래비용 감소 → 효율성 증가

1) 개념 : 개인의 능력(인적 자본)이 아니라 사람들 간의 관계(네트워크) 속에서 형성되는 자원

2) 핵심 요소 : 신뢰(Trust), 상호성(Reciprocity), 네트워크

3) 특징

- 신뢰를 기반으로 협력을 촉진함

- 계약, 감시, 협상 등에 드는 거래 비용(Transaction Cost)을 감소시킴

- 사회 전체의 효율성과 생산성을 향상시킴

- 과도한 신뢰 관계는 금전 거래 문제 등 위험 요소도 수반할 수 있음

Social Capital(사회적 자본)의 의미와 경제적 효과
개인의 능력이 아닌 네트워크 관계에서 형성되는 무형의 자본으로 신뢰와 상호성을 기반으로 함
신뢰가 형성된 관계에서는 복잡한 계약이나 통제가 즐어들어 거래 비용(Transaction Cost)이 감소하고 그 결과 경제적 효율성과 생산성이 향상됨

3.4 시장과 조직에서의 연결망

1) 승자 독식 현상

- 연결망 외부성으로 인해 1위 기업이 시장을 독점하는 현상이 강화됨

단, 기술의 세분화와 빠른 상품 주기가 이를 제한하기도 함
2) 조직의 연결망화 : 벤처 기업 간의 정보 교환(약한 연결)과 전략적 제휴(강한 연결)를 통해 네트워크 효과를 극대화함

(예: 실리콘밸리)

3.5 노동시장과 구조적 공백

네트워크가 단순한 관계의 합이 아니라 그 '구조' 자체가 권력, 정보, 자본이 된다는 점을 강조

특히 '약한 연결'과 '구조적 공백'은 현대 사회에서 성공을 결정짓는 핵심적인 위치 지표임

1) 약한 연결의 힘(Strength of Weak Ties)

- 그라노베터의 연구에 따르면 구직 시 가족/친척(강한 연결)보다 단순히 아는 사람(약한 연결)을 통해 얻은 정보가

더 효과적 → 약한 연결이 내가 모르는 새로운 정보를 전달하는 '교량(Bridge)' 역할을 하기 때문
2) 구조적 공백(Structural Holes) : 버트(Burt)가 제안한 개념으로 서로 연결되지 않은 두 집단 사이를 잇는

'비중복적' 위치를 의미
- 구조적 공백의 이점
. 정보의 효율성 : 중복되지 않는 다양한 정보를 선점할 수 있음
. 통제 이점 : 두 집단 사이에서 협상을 유리하게 이끄는 '테르티우스 가우덴스(즐거워하는 제3자)'가 될 수 있음

어느 연결망이 더 유리한가? (A의 입장)
폐쇄적 연결망(중복적) : 내 친구들이 서로 다 아는 사이, 신뢰와 정서적 지지가 높지만 정보는 중복됨
구조적 공백이 있는 연결망(비중복적) : 내 친구들이 서로 모르는 사이, A가 유일한 통로가 되어 정보의 희소성과
권력을 장악하기에 유리함
새로운 기회를 포착하고 영향력을 발휘하기에는 '구조적 공백'을 점유한 연결망이 더 유리함

4.1 데이터 구조와 그래프 이론

- 사회연결망분석(SNA)는 "관계 자체가 데이터다"라는 전제에서 출발

- 개인의 속성보다 행위자가 어떤 네트워크 구조(행렬(Matrix) / 그래프) 속에 위치하는지를 파악하는 것이 핵심

- 연결망의 구조적 특징 파악, 관계 패턴을 통해 사회 시스템의 특성 도출, 네트워크 구조를 기반으로 행위자의 행동 설명

4.1.1 사회연결망 데이터의 차별점

	전통적 데이터 (Conventional Data) → 사람	네트워크 데이터 (Network Data) → 관계
특징	개인의 특성 중심 분석 예) 소득이 높은 사람은 어떤 성향을 보이는가?	관계와 구조 중심 분석 예) 네트워크 내 위치가 행동과 성과에 어떤 영향을 미치는가?
구조	직사각형 행렬(행(Row) = 행위자, 열(Column) = 속성) * 행(관측치) : 열 (변수)	노드 간 관계를 나타내는 정사각형 형태의 인접행렬 (Row / Column = 동일 행위자)
분석 대상	나이, 소득, 학력 등 속성(Attribute)	행위자 간 관계(Relation)
분석 방식	변수 간 관계, 상관관계 분석	- 네트워크 내 위치(Position) - 구조 속에의 매몰성(Embeddedness)

전통적 데이터(직사각형)와 네트워크 데이터(정사각형 행렬)의 차이
전통적 데이터는 직사각형 구조(행=개체, 열=속성)로 개인의 특성을 분석하는 반면, 네트워크 데이터는 정사각형 행렬(행·열=동일 개체)로 개체 간 관계(Relationship)를 표현함 → 속성 중심과 관계 중심의 차이

사회연결망분석이 기존 사회과학 분석과 다른점
기존 사회과학은 개인의 소득, 학력 등 속성(Attribute)을 중심으로 사회 현상을 설명하는 반면 사회연결망분석은 개인 간 관계(Relation)와 네트워크 내 위치(Position)를 분석 단위로 삼음
따라서 인간의 행동을 개인 특성뿐 아니라 네트워크 구조 속에서 전체론적으로(Holistic) 현상 분석이 가능함

4.2 모집단과 샘플링의 한계

네트워크 분석에서는 일반적인 설문조사에서 사용하는 '독립적 표본 추출'이 어려움

1) 관계의 상호의존성

- 한 행위자를 선택하면 그와 연결된 타인(Ego-Alter)과의 관계도 함께 분석해야 하므로 샘플링이 까다로움

2) 경계 설정 (Boundaries)

- 인위적 경계 : 학급, 조직, 클럽 등 이미 정해진 집단

- 인구학적/생태학적 접근 : 특정 지역 거주자나 특정 소득 수준 등 기준에 의한 설정

3) 자료 수집 방법

- 전체를 조사하는 전수 조사(Full network)나 한 명에서 시작해 관계를 타고 뻗어 나가는

스노볼 방법(Snowball methods) 등이 사용

4.3 그래프 이론을 통한 네트워크의 표현

네트워크는 수학적으로 G = (V, E)로 표현 (V는 점 / Node, E는 선 / Edge)

1) 데이터 표현 방식

- 인접 행렬 (Adjacency Matrix) : 노드 간 연결 여부를 0과 1(또는 가중치)로 표시한 정사각 행렬

- 노드 리스트 (Node List) : 각 노드와 그에 연결된 노드들을 나열

- 에지 리스트 (Edge List) : 연결된 두 노드의 쌍을 나열 (가중치 표현에 용이)

2) 그래프의 종류

- 방향성 여부 : 유방향(Directed) / 무방향(Undirected) 그래프

- 관계의 강도 : 이진(Binary, 0/1) / 가중(Valued, 수치) 그래프

- 밀도에 따라 완전 연결(Fully connected) / 희소(Sparse) 그래프

4.4 그래프의 주요 개념 및 지표

네트워크의 구조적 특징 파악

개념	설명
차수 (Degree)	- 한 노드에 연결된 선의 수 - 유방향일 경우 내차수(In-degree)와 외차수(Out-degree)로 구분
크기 (Size)	일반적으로 네트워크에 포함된 노드의 총수
경로 (Path)	한 노드에서 다른 노드로 가는 연결선들의 시퀀스
거리 (Distance)	두 노드 사이의 최단 경로(Geodesic distance)
직경 (Diameter)	네트워크 내 모든 최단 거리 중 가장 긴 거리

4.5 하부 구조와 연결성

네트워크 내에는 특별한 형태를 가진 부분 집합들이 존재

1) 연결성 (Connectivity) : 모든 점들 사이에 경로가 존재하면 '연결된 그래프'라고 함

2) 컴포넌트 (Component) : 서로 연결된 노드들의 최대 집합 (고립된 섬 같은 구조)

3) 클리크 (Clique) : 모든 구성원이 서로 직접 연결된 완전 부분 그래프 (고도로 응집된 소집단)

4) K-Core : 모든 노드가 적어도 k개 이상의 다른 노드와 연결되어 있는 서브그래프

4.6 측정 척도(Scales of Measurement)

관계의 성격에 따라 데이터의 수준이 달라짐

1) 이진 (Binary) : 친구인가 아닌가 (1/0)

2) 서열 (Ordinal) : 좋아하는 순위 (1위, 2위...)

3) 구간 (Interval) : 이메일을 주고받은 횟수 (연속된 수치)

5.1 연구 설계와 중앙성 지표

5.1.1 연결망 분석의 연구 설계

네트워크 연구의 핵심은 현실의 복잡한 현상을 노드(Node)와 링크(Link)로 단순화하여 분석하는 것

1) 연구 단계

① 문제 제기 : 연구 동기, 목적 및 가설 설정

② 데이터 수집 : 노드(사람, 조직) / 링크 정의(친구, 협업, 정보흐름), 바운더리 설정(Full, Ego)
자료 수집 방법(설문, 크롤링, 로그 데이터, 마이닝 등) 조사

③ 네트워크 생성 : 데이터 전처리, 인접행렬 / 엣지리스트 변환, 코딩 및 시각화

④ 네트워크 분석 : 중심성(degree, betweenness 등), 밀도, 클러스터링, 커뮤니티 구조,
결과 해석 및 사회적 의미 연결/현상 설명

2) 분석 단위와 수준

- 분석 단위 : 개인, 조직, 클릭, 국가 등

예) 인터넷 교통량 분석 시 '개인'을 단위로 할지 '클릭'을 단위로 할지에 따라 결과가 달라짐

- 분석 수준 : 개별 노드, 쌍(Dyad), 3자 관계(Triad), 부분집단 등

연구설계에서 노드와 링크 정의가 중요한 이유
네트워크 분석은 연구 대상에 따라 그 지배 법칙이 달라짐
따라서 분석의 출발점으로서 행위자(노드)를 개인, 클릭, 또는 사이트 중 무엇으로 볼 것인지 명확히 해야 함
또한 링크를 단순 상호작용으로 볼지, 동시 출현(Co-occurrence)으로 정의할지에 따라 완전히 다른 해석이 도출됨
명확한 정의가 없다면 데이터 수집 범위(Boundary)를 확정할 수 없음

5.2 연결망 분석의 접근법

1) 관계적 접근 (Relational Approach)

- 행위자 간 직접적인 연결과 상호작용을 중시

- 관계를 통해 행동이 전염/확산된다고 봄

예) 친구가 흡연하면 나도 영향을 받아 흡연할 가능성이 증가

2) 위치적 접근 (Positional Approach)

- 직접 연결이 없어도 네트워크 내 구조적 위치가 유사하면 유사한 행동을 보인다고 봄

- 역할, 지위, 기능의 유사성이 중요

예) 같은 계층(자본가, 전문직 등)에 속한 집단은 유사한 인식과 행동을 보임

3) 구조주의적 관점 - 행동은 개인이 아니라 구조가 만듦

- 개인의 속성보다 관계 구조와 환경(네트워크)이 행동에 미치는 영향을 강조

- 행동은 개인의 의도뿐 아니라 구조적 조건의 산물로 이해됨

예) 밀집된 환경에서는 개인 의도와 무관하게 쓰레기 투기 등 특정 행동이 발생

- 특징 : 구조적 효과(Structural Effect) 강조, 개별 요소의 단순 합으로 전체를 설명할 수 없음,

네트워크에서 나타나는 창발성(Emergence) 중시

구조주의적 관점의 의미
구조주의는 행위자의 개인적 특성보다 그들이 속한 관계 구조와 환경이 행동에 미치는 영향(구조적 효과)을 강조하는 관점임
즉, 행동은 개인의 의도뿐 아니라 네트워크의 연결 구조와 밀집도에 의해 형성되며 개별 요소의 합으로 설명할 수 없는 창발적 현상이 나타남

6.1 네트워크 역학과 구조적 공백

네트워크의 응집도(상호성, 이행성)와 개별 행위자의 전략적 위치(구조적 공백, 제약성)를 수치화하는 방법

"제약성이 낮고 효율적 크기가 큰" 위치가 정보와 권력 획득에 최적임을 수학적 예제를 통해 이해하는 것이 핵심

6.1.1 네트워크 및 노드 수준의 속성

- 네트워크 분석은 분석의 범위에 따라 전체 구조를 나타내는 지표와 개별 노드의 특성을 나타내는 지표로 나뉨

6.1.1.1 네트워크 속성 (전체 수준) * 네트워크 전체 구조적 특징을 나타내는 지

1) 크기(Size) : 노드의 수

2) 밀도(Density) : 전체 가능한 연결 대비 실제 연결 비율 * N : 노드 수

- 밀도 = 실제 링크 수 / 가능한 최대 링크 수 → 높을수록 촘촘한 네트워크

. 가능한 최대 링크 수 = 무방향 네트워크 N ( N - 1) / 2

방향 네트워크 N (N - 1)

예) 가능한 링크 6개 중 실제 4개 → 4 / 6 = 0.67

. 값이 클수록(연결이 촘촘, 상호작용 활발, 응집력(결속력) 높음)

. 값이 작을수록(연결이 느슨한, 상호작용 제한적)

. 무방향 그래프에서 반드시 /2 적용 (중복 연결 방지)

무방향 네트워크 (Undirected) → 관계에 방향 없음 (친구 관계)
가능한 최대 연결 수
가능한 쌍 (N(N-1)/2 = 4 × 3 / 2 = 총 6개) * A-B와 B-A는 같은 관계라서 1개로 봄
(A-B, A-C, A-D) (B-C, B-D) (C-D)
실제 연결 예시
(A-B) (A-C) (B-C) 실제 연결 3개, 밀도 계산 = 3 / 6 = 0.5

방향 네트워크 (Directed) → 관계에 방향 있음 (A → B)
가능한 최대 연결 수
A → B, B → A (다름) 그래서 경우가 2배, N(N-1) = 4 × 3 = 12
실제 연결 예시
(A → B, A → C) (B → C) (C → A) 실제 연결 = 4개, 밀도 계산 = 4 / 12 = 0.33

(행렬 계산) 방향성(Directed) 유무에 따라 밀도(Density) 계산 시 분모가 어떻게 바뀌는지?
Density 분모 (Directed vs Undirected)
네트워크 밀도는 전체 가능한 관계 대비 실제 관계 비율로, 무방향 네트워크는 N(N-1)/2, 방향 네트워크는 N(N-1)로 가능한 관계 수가 증가하여 분모가 달라짐

3) 포괄성(Inclusiveness) : 전체 노드 중 고립 노드(Isolate)가 아닌 연결에 참여하는 노드의 비율

4) 중심화(Centralization) * 전체의 집중도

. 네트워크가 특정 노드에게 얼마나 집중되어 있는지를 나타내는 지표 * 별 구조일수록 중심화가 높음

6.1.1.2 노드 속성 (개별 수준) - 개별 행위자의 위치와 중요도를 나타내는 지표

- 중앙성(Centrality): 특정 노드가 네트워크 내에서 얼마나 중요한 위치에 있는지 측정 * 개인의 중요도

예) Degree, Betweenness, Closeness 등

6.1.2 관계 단위 지표 (2개 이상 노드 속성)

1) 기본 관계 지표(노드 수준 속성)

- 연결거리(Distance) : 두 노드 간 최단 경로 길이

- 도달가능성(Reachability) : 한 노드가 다른 노드에 도달 가능한지 여부

- 최대 흐름 (Maximum Flow) : 노드 사이 전달 경로의 다중성 (전염 확률과 직결)

2) 관계적 속성

- 상호성(Reciprocity)

. 서로가 서로를 연결(지목)하는 정도 → 신뢰와 상호작용의 강도 반영

- 이행성(Transitivity)

. A-B, B-C가 연결되면 A-C도 연결될 가능성 → 관계의 삼각 구조 형성 경향

. '내 친구의 친구는 내 친구'가 성립하는 정도

- 군집화 계수(Clustering Coefficient)

. 내 친구들끼리 서로 연결된 정도 → 가능한 연결 수 k(k - 1) / 2 대비 실제 연결 비율

. 특정 노드의 이웃들이 서로 연결되어 집단을 형성하는 정도

. 값이 클수록 소집단(Clique) 형성, 응집력/신뢰 수준이 높은 집단 구조 의미,

Ego 네트워크의 닫힘 정도를 측정하는 핵심 지표

3) 구조적 효율성 지표

- 유효크기(Effective Size)

. Ego 네트워크의 비중복 관계 수

. 값이 클수록 (중복성 낮음, 다양한 집단과 연결, 구조적 공백 활용 가능성 높음)

. Effective Size = Size - Redundancy

- 중복성(Redundancy) : 내 연결들이 서로 겹쳐 있는 정도 → 값이 높을수록 정보 중복 많고 비효율적

- 제약성(Constraint)

. 특정 노드에 대한 직/간접 의존도를 측정

. 값이 클수록(특정 관계에 과도하게 의존, 네트워크 자유도 감소, 구조적 공백 활용 어려움)

. 직접 연결 + 간접 경로(제 3자 경유)를 모두 반영, 계산 시 합을 제곱, 값이 클수록 좋은 것이 아니라 불리한 구조

※ 상호성 / 이행성 / 군집화 = 관계의 응집성

※ 유효크기 / 중복성 / 제약성 = 관계의 효율성

※ 친구들끼리 뭉치면 응집↑, 겹치지 않게 연결되면 효율↑

중심화 지표 도출

1) [분자] 불평등도의 합 : 최대 중앙성 노드와 나머지 노드들의 중앙성 차이 (격차) 총합

[분모] 이론적 최대치 : Star Network 기준, 가능한 가장 큰 차이의 합

※ 중심화 지표는 실제 집중도 ÷ 최대 가능 집중도를 산출하는 비율

2) 중앙성과 중심화 차이

- 중앙성 : 개별 노드의 속성 (마이크로 지표), 특정 단일 노드가 네트워크 내에서 얼마나 중요한 위치를

차지하고 있는가를 측정

- 중심화 : 네트워크 전체의 속성 (매크로 지표), 네트워크가 전체적으로 얼마나 소수에게 중앙 집중적인 구조를

가졌는지 측정

. 측정원리 : 개별 노드의 중앙성지표를 2차적으로 활용하여 행위자 간 지표의 범위나 변동성을 정량화 함

4개의 노드로 이루어진 Star Network 형태의 계산 (g = 4)

6.2 유사성(Similarity) 및 등위성(Equivalence)

행위자들이 네트워크 내에서 얼마나 닮았는지를 측정하는 개념

1) 유사도 측정 지표

- 이진 데이터 : 자카드(Jaccard) 계수 (둘 다 없는 항목 'd'를 제외하고 계산)

- 가중치/거리 : 유클리드 거리 (정규화 필요), 피어슨 상관계수 (-1 ~ 1)

2) 등위성(Equivalence)의 종류

- 구조적 등위성(Structural Equivalence) : 직접 연결되지 않았어도 연결된 대상(이웃)이 같으면 같은 위치로 간주

- 형태 등위성(Automorphic Equivalence) : 연결망 지표(중앙성, 차수 등)가 동일한 위치를 의미

6.3 소속 집단 분석

1) 결속 집단(Clique) : 모든 구성원이 서로 직접 연결된 완전한 하부 집단

2) 구성 집단(Component) : 노드들끼리 경로가 존재하여 연결된 최대 집합

3) 2중 구성 집단(Bi-component) : 특정 노드가 빠져도 연결이 유지되는 것, 즉 두 개 이상의 경로로 연결된 견고한 집단

6.4 구조적 공백(Structural Holes)

로널드 버트(Ronald Burt)가 제안한 개념으로 네트워크 내에서 서로 연결되지 않은 집단 사이의 '공백'을 점유하는 것이

전략적으로 유리하다는 이론

1) 핵심 이점 : 정보 선점, 통제력(중재) 확보, 승진 및 생산성 향상

2) 주요 측정 지표

- 중복성(Redundancy) : 내 이웃들이 서로 연결되어 있어 정보가 겹치는 정도

- 제약성(Constraint) : 나의 에너지가 특정 관계에 집중되어 있거나 내 이웃들이 서로 얽혀 있어

내가 활용할 수 있는 공백이 적은 정도 (제약성이 낮을수록 유리)

- 효율적 크기(Effective Size) : 실제 인원수에서 중복성을 뺀 수치 (Size - Redundancy)

6.5 중재와 브로커리지 (Brokerage)

두 집단 사이를 잇는 중재자의 역할은 소속 관계에 따라 5가지 유형으로 구분 (Gould & Fernandez)

1) 조율자(Coordinator) : 동일 집단 내 구성원 간 중재

2) 자문가(Consultant) : 타 집단 구성원 간의 관계를 외부인으로서 중재

3) 문지기(Gatekeeper) : 외부의 정보를 자기 집단으로 들여보냄

4) 대표자(Representative) : 자기 집단의 정보를 외부로 전달

5) 연락책(Liaison) : 서로 다른 두 외부 집단 사이를 중재

6.6 변두리 - 에지 사이 중앙성(Edge Betweenness)

1) 정의 : 네트워크 내 모든 최단 경로 중 특정 '선(Edge)'이 포함되는 횟수

2) 의미 : 높은 에지 사이 중앙성을 가진 선은 두 집단을 잇는 교량(Bridge) 역할을 하며 이 선이 제거될 경우 네트워크가

두 개의 커뮤니티로 분리될 가능성이 큼

7.1 UCINET 자료 처리와 시각화

SNA를 UCINET 소프트웨어를 통해 실제로 구현하는 과정으로 DL 파일을 정확히 작성하는 법과 노드 속성을 결합하여 가독성 높은 시각화 결과물을 도출

7.1.1 UCINET 자료 입출력 방식
UCINET에서 데이터를 다루는 방법 3가지
1) 행렬 편집기(Matrix Editor) : 엑셀과 유사한 인터페이스에 직접 데이터를 입력하거나 붙여넣는 방식
2) 파일 불러오기 : 엑셀(.xlsx)이나 텍스트 파일을 변환하여 사용
3) UCINET 전용 파일 : .##h(헤더 파일)와 .##d(데이터 파일) 세트로 구성되며 분석 시 두 파일이 반드시 같은 폴더에

있어야 함

7.2 DL(Data Language) 파일의 활용

DL 파일은 텍스트(.txt) 형식으로 작성하며, 데이터 구조를 명시하는 헤더(Header)와 데이터(Data) 영역으로 구분

1) 주요 데이터 포맷
- Full Matrix : 전체 행렬을 그대로 입력
- Rectangular Matrix : 행(nr)과 열(nc)의 크기가 다른 행렬
- Nodelist : 특정 노드에 연결된 노드들만 나열 (1-mode : Square, 2-mode : Rectangular)
- Edgelist

. '출발 노드 - 도착 노드 - 가중치'의 형태로 관계를 나열

. 데이터 양이 방대하고 0이 많은 희소 행렬(Sparse matrix) 분석에 효율적
2) DL 파일 옵션
- Labels : 행/열의 이름을 지정하거나 데이터 속에 포함(Embedded)시킬 수 있음
- Format : lowerhalf(하삼각형), diagonal=absent(대각선 제외) 등을 설정 가능
- Multiple Matrices : nm=2와 같이 설정하여 여러 개의 관계(결혼, 비즈니스 등)를 한 파일에 저장 가능

7.3 노드 속성(Attribute) 활용 및 시각화

단순히 관계망을 그리는 것을 넘어 노드의 특성(성별, 직급, 부서 등)을 시각적으로 표현하여 분석의 깊이를 더함

1) 시각화 설정 (NetDraw)
- 색상(Color) : 특정 속성(예: 소속 부서)에 따라 노드 색상 지정
- 모양(Shape) : 노드의 성격에 따라 원, 사각형 등으로 표현
- 크기(Size) : 중앙성(Centrality) 지표에 비례하여 중요한 노드를 크게 표시
2) 절차 : Analysis > Centrality Measures를 통해 중앙성을 계산한 후 Properties > Nodes > Symbols 옵션에서

속성 데이터를 연결함

7.4 연결망의 시각화 및 배치(Layout) 기법

네트워크의 구조적 특징을 잘 드러내기 위해 다양한 배치 알고리즘을 사용함

1) MDS (Multi-Dimensional Scaling) : 노드 간의 유사성/거리를 기반으로 평면에 배치

(Layout > Gower 또는 Non-Metric MDS).
2) Spring Embedding : 노드 간 인력과 척력을 이용해 균형 있는 구조를 찾음 (Layout > Graph Theoretic Layout).
3) Circle Layout : 모든 노드를 원형으로 배치하여 전체적인 연결 구조 파악
4) Ego Network : 특정 노드(Ego)를 중심으로 1~3단계 이내의 관계자들만 추출하여 시각화

7.5 [실습 예제] 항공사 연결망 분석

1) 데이터 형식 : format = edgelist1, labels embedded
2) 구조 : 항공사 간의 협력이나 노선 공유 데이터를 '항공사 A, 항공사 B, 가중치(수치)' 형태로 입력하여

대규모 네트워크 분석을 수행함

8.1 네트워크의 진화와 구조적 유형

현실 세계의 네트워크(인터넷, 사회관계, 도시 구조 등)가 왜 정규분포를 따르지 않는지

그리고 '허브'와 '지연결성'이 어떻게 효율성과 불평등을 동시에 만들어내는지를 이해

8.1.1 무작위 그래프(Random Graphs)

- 개념

. 노드 쌍들이 무작위적으로 연결된 네트워크. (단추와 실의 비유)

. 링크가 완전히 무작위로 생성됨, 평균 경로 길이가 짧음, 군집화 계수가 낮음

- 상전이(Phase Transition) : 평균 연결 수 z > 1 이 되면 거대 연결 요소(Giant Component)가 형성됨 (임계현상)

8.2 작은 세상 네트워크 (Small World Networks)

가까운 사람끼리는 촘촘하고 전체적으로는 몇 단계 안에 연결되는 구조

1) 정의

- 높은 군집화 계수(Clustering Coefficient, C)를 유지하면서도

노드 간 평균 경로 거리(Average Path Length, L)가 매우 짧은 네트워크

- 지역적으로 촘촘히 연결되어 있고 전체적으로 소수의 단계만으로 서로 연결되는 구조

- 거대한 네트워크에서도 몇 단계만 거치면 대부분 연결 가능

- 정보 확산, 바이럴, 협업 구조 설명에 매우 중요 * 예) 6단계 분리 법칙 (Six Degrees of Separation)

2) Duncan J, Watts & Steven Strogatz 모델

- 초기 상태 : 규칙적인 격자 구조(regular lattice, caveman 구조)

- 과정 : 일부 링크를 무작위로 재연결(Rewiring)

- 결과 : 소수의 랜덤 연결만 추가해도 평균 경로(L)가 급격히 감소

- 특징

. 군집화 계수 : C >> C_rand(무작위 그래프보다 훨씬 큼)

. 평균 경로 길이 : L = L_rand(무작위 그래프와 유사하게 짧음)

→ L이 “더 짧은 것”이 아니라 “비슷하게 짧은 것”이 중요

4) Stanley Milgram의 Small World 실험
- 서로 모르는 사람들 사이에서도 평균적으로 약 6단계 연결을 통해 도달 가능함을 실험으로 제시

- 현실 사회 네트워크가 “작은 세상 구조”를 가짐을 보여줌

5) Small-World와 Scale-Free 비교 (중요)

	Small-World	Scale-Free
기준	C, L	Degree 분포
특징	- 높은 군집화 + 짧은 경로 - Small-world = “거리 + 군집 구조” - Small-world → C >> C_rand & L ≈ L_rand ※ L(경로 길이), C(군집 계수) - 거리 구조(짧은 연결)	- 특정 노드에 연결이 집중 (멱함수 분포, Power-law) ※ Alpha(멱함수 지수) - Scale-free = “연결 분포 구조” - Scale-free → Degree 분포가 멱함수 - C와 L을 Random graph와 비교할 경우 Log-Log 그래프에서 직선 → Scale-free 판단 - 허브 중심 구조(불균형)

Small-world Network의 특징과 판별 기준(C는 높고 L은 비슷함)
작은 세상 네트워크는 거대한 네트워크에서도 임의의 두 노드가 짧은 단계 내에 연결되는 구조를 가지며 동일 규모의 무작위 그래프와 비교할 때 평균 경로 길이(L)는 유사하게 짧고(L ≈ L_rand), 군집화 계수(C)는 훨씬 높은(C >> C_rand) 특징을 보일 때 판정함

8.3 척도없는 네트워크 (Scale Free Networks)

1) 정의 : 연결정도 분포가 멱함수(Power Law)를 따르는 네트워크로 p(k) α k^-alpha와 같이 표현

2) 특징

- 허브(Hub)의 존재 : 대다수의 노드는 연결이 적고 소수의 노드(Hub)가 매우 많은 연결을 가짐

- 두꺼운 꼬리(Fat Tail) : 극단적인 값(허브)이 무시되지 않고 높은 확률로 존재

- 불균형 구조 : 연결이 일부 노드에 집중되는 "부익부 빈익빈" 현상 발생

3) 형성 원리

- 성장(Growth) : 네트워크는 시간이 지남에 따라 계속 확장됨 * 예) WWW, 인용 네트워크

- 선호적 연결(Preferential Attachment) : 새로운 노드는 기존에 연결이 많은 노드에 더 높은 확률로 연결됨

→ 마태효과(Rich-get-richer)

8.3.1 Scale Free의 의미(척도 불변성)

1) 정의 : 단순히 '척도가 없다'가 아니라 '스케일이 변해도 구조가 유지된다'는 의미

2) 척도 불변성(Scale Invariance) : 로그-로그 그래프에서 직선 형태로 나타나며 단위를 확대하거나 축소해도

분포의 형태(자기유사성)가 유지됨

3) 자기유사성(Self similarity) : 부분 구조는 전체 구조와 유사한 형태로 프랙탈(Fractal) 구조와 연관

Scale-free 네트워크에서 α(Alpha)의 의미(척도 불변성)
α(알파)는 멱함수 분포 p(k) α k-α에서의 기울기(지수)로 로그-로그 그래프에서 직선 기울기를 의미하며 α값에 따라 허브 집중도의 정도(불균형 수준)가 결정됨

Scale-free Network의 형성과 특징
연결 분포가 멱함수(Power law)를 따르며 소수의 허브 노드가 대부분의 연결을 차지하는 구조로 지속적인 성장(Growth)과 연결이 많은 노드에 더 많이 연결되는 선호적 연결(Preferential Attachment) 특성에 의해 형성되며 그 결과 부익부 빈익빈 구조가 나타남

8.5 도시와 생태계의 스케일링 (Geoffrey West)

도시의 규모(N)에 따라 사회경제적 지표가 변화하는 방식은 3가지로 나뉨

1) 선형 스케일링 (Linear) : 주택수, 고용, 전력 소비 등은 도시 크기에 비례하여 증가

2) 하선형 스케일링 (Sub-linear) : 도로, 전선, 수도관 등 인프라는 도시 규모가 2배 커질 때 약 85%만 필요함

(규모의 경제, 15% 절감)

3) 상선형 스케일링 (Super-linear) : GDP, 임금, 특허 수, 범죄, 질병 등은 도시 크기 대비 약 15% 더 많이 발생

(시너지 및 부작용)

8.6 결론 및 논의

1) 관계 : 척도 없는 네트워크(Scale-free)는 대개 작은 세상(Small-world) 성질을 동시에 가짐

(허브가 지름길 역할을 하기 때문)

2) 진화 : 네트워크는 단순히 무작위로 형성되는 것이 아니라 '선호적 연결'과 '성장'이라는 동역학을 통해

유기적으로 진화함

구조적 위치가 권력을 만든다 누가 협상에 가장 유리한가?

A, B, C 모두 연결된 친구의 숫자는 4명일 경우 이들의 영향력은 과연 같은가?

→ 아니다. 단순한 연결 수(Dgree) 보다 전체 구조 내에서 위치와 중개자 역할이 협상력과 파워를 결정함

저작자표시 비영리 변경금지 (새창열림)

'[Industry Knowledge Sharing] > Graduate' 카테고리의 다른 글

Social Network Analysis Python (0)	2026.05.17
Graph Neural Networks(GNN) / Graph Convolutional Networks(GCN) (0)	2026.05.17
10. 상관분석에서 다중회귀분석까지 관계의 발견과 인과관계 (3)	2026.05.05
복잡한 통계 계산 문제 시각화로 끝내는 이해 가이드 (0)	2026.04.28
Statistical Research Methodology Key Definition Description (0)	2026.04.28

Like a Tree

Social Network Analysis

'[Industry Knowledge Sharing] > Graduate' 카테고리의 다른 글

티스토리툴바

Social Network Analysis

'[Industry Knowledge Sharing] > Graduate' 카테고리의 다른 글

관련글

티스토리툴바