Ⅰ. 서 론
우리나라의 합계출산율은 2022년 역대 최저치인 0.78명을 기록하였고, 올해 2023년에는 0.73명, 내년 2024년은 0.7명으로 계속 하락할 것으로 전망되고 있다(통계청, 2023). 우리나라는 2013년 이 래 OECD 회원국 중 가장 저조한 합계출산율(가임기인 15~49세 여성 1명이 가임기간 동안 낳을 것으 로 예상되는 평균 출생아 수)을 보이고 있으며, 2018년 이후 유일하게 합계출산율이 1.0 미만으로 기 록되고 있는 국가이다. OECD기준으로 저출산은 합계출산율이 2.1명 이하인 현상을, 초저출산은 합계 출산율 1.3명 이하를 의미하며 우리나라는 실상 초저출산 국가이다(신윤정, 이명진, 박신아, 2019). 저출생의 이슈는 우리나라의 인구 구조 유지에도 심각한 영향을 주는 국가적 과제이기 때문에 정부에 서도 저출산 문제의 심각성을 인식하고, 2005년,「저출산 ‧ 고령사회기본법」을 제정하였으며 대통령 직 속기구로 ‘저출산 ‧ 고령사회 위원회’를 설치하였다. 이후로 2006년부터 현재에 이르기까지 오랫동안 저출산 문제 해결을 위해 15년간 3차례의 ‘저출산 ‧ 고령사회 기본계획’을 추진하였으며 아동수당 도입, 무상보육 시행 등의 노력으로 소기의 성과도 있었으나 이렇게 막대한 예산을 쏟아 붓고 있음에도 불구 하고 오히려 저출산의 현상이 욱 악화되고 현실에, 출산율 반등에 대한 정책 실효성에 대해 끊임없이 비판을 받고 있다.
초저출산 현상은 단순히 태어나는 아이의 수가 적음의 문제가 아닌 학령인구와 병역자원 부족, 경제 활동 및 생산연령인구의 감소, 지역소멸 가속화 등 경제 및 사회 전반에 광범위한 영향을 미칠 수 있어 국가의 존폐위기까지 논할 수 있는 상당히 중요한 문제이다. 저출산으로 인해 경제활동이 가능한 생산 인구가 줄어들고 상대적으로 노인인구의 비중은 늘어나고 있어, 고령화 속도 역시 함께 빨라지고 있기 때문이다. 통계청에서 조사한 바에 따르면 우리나라는 2000년 노인 인구의 비율이 7.2%를 기록하여 고령화 사회에 진입하였는데, 그 이후 20년도 채 걸리지 않아 2017년, 14.3%를 기록하여 고령사회가 되었다. 베이비붐 세대인 1955년생이 노인인구로 편입됨에 따라, 지금 추세대로라면 매년 1%씩 노인 인구 비율이 증가하게 되고, 이에 통계청은 우리나라가 2025년 고령화율 20%가 넘는 초고령 사회로 진입할 것으로 예측하고 있다(통계청, 2022). 물론 일본(2005년)이나 이탈리아(2006년), 독일(2009 년), 핀란드와 그리스(2015년), 그리고 스웨덴(2017년)도 초고령 사회에 도달한 국가이지만 우리나라 와의 차이가 있다면 바로 속도라는 점이다. 단순히 고령인구의 증가 뿐 아니라 우리나라는 저출산 현상 과 맞물리면서 인구 구조에 급격한 변화가 나타나 인구 절벽, 국가 소멸 위기라는 표현까지 등장하게 된 것이다.
저출산 및 초저출산율에 대한 심각성은 통계청에서 보고되는 인구동향이나, 매년 연간 합계출산율이 발표될 때마다 다수의 언론 매체를 통해 전달되는 뉴스로 체감할 수 있다. 정책이 발표되는 시점에는 정책에 대한 홍보와 기대감이 등장하고, 시간의 흐름에 따라 다양한 내용이 다뤄지다가 해당 5개년 계 획이 종료될 시점에는 전반적인 실효성 및 효과성에 대한 정부 및 학계, 대중의 평가 및 향후 새로 도입 하게 되는 계획과의 차별성 등으로 뉴스의 흐름과 변화를 인지하게 된다. 특히 대중은 미디어를 통해 접하는 뉴스를 통해 여러 가지 반응을 보인다. 본 연구에서는 저출산에 대한 논의가 시간의 흐름에 따 라 어떻게 변화 되어져 왔는지, 특히 저출산 문제를 해결하기 위해 정부 주도로 5개년 계획이 발표된 시 점들을 중심으로 뉴스를 통한 빅데이터 분석을 실시하여 저출산 현상을 둘러싼 우리 사회의 대응을 시 계열적으로 살펴보고자 한다.
그동안 저출산의 문제가 심각하게 고착화 된 만큼 문제를 파악하기 위해 원인을 진단하거나, 정책의 효과성 평가와 관련해서 수많은 연구들이 진행되어 왔다(정혜영, 김병만, 2022;이지운, 강은진, 2022;김미진, 손유진, 서보순, 2021;임병인, 이지민, 2020;김수정, 2019;김정희, 2019;김천권, 정진원, 2019;최영미, 박윤환, 2019;변수정, 황남희, 2018;이지영, 2017). 그러나, 상대적으로 저 출산, 출산율에 대한 담론을 매스미디어를 분석의 대상으로 삼고 수행된 연구는 거의 미비한 실정이었 다. 그래도 최근 들어 저출산 현상과 관련된 빅데이터의 구축 및 정보 활용의 용이성으로 새로운 분석 기법을 적용하는 연구들이 조금씩 등장하고 있다.
비교적 최근에 수행된 연구 가운데에서 김연권(2019)은 2003년부터 2018년까지 보수와 진보(조선 일보, 중앙일보 vs 한겨례, 경향신문)의 4개의 언론사를 지정하여 해당 언론사에서 보도된 저출산 관련 기사들의 논조를 분석하였다. 저출산의 문제를 국가주의적 관점에서 국가쇠망론과 경제침체론에 근거 하여 논의하였고, 젠더적 해석에 따라 저출산 현상을 풀이하는 방향이 달라질 수 있음을 보고하였다. 이소영 외 연구진(2019)은 2018년~2019년 사이에 ‘인구 감소’를 키워드로 저출산 관련 기사 및 댓글 을 크롤링하여 버즈 양의 분석, 감성 분석, 연관어 분석을 실시하였다. 출생아 및 인구 감소에 따른 대 중의 인식을 통해 감성분석을 실시했다는 점이 인상적이었는데, 학령인구 및 생산인구의 감소, 지방소 멸 등 인구감소에 따른 부정적 파급효과에 대해 국민들 역시 관심을 가지고 있었고 이에 대해 대체로 부 정적인 감정을 드러내고 있다는 점을 확인할 수 있었다. 송민호와 이수범(2018)은 2015년부터 2017 년까지 약 2년간 소셜미디어(트위터)에 등록된 저출산과 관련된 메시지를 분석대상으로 삼았는데, 상 위 빈도에 대한 의미연결망 분석을 수행하였다. 트위터에서 11,984건의 메시지를 분석하여, 결혼 및 출산에 대한 장려 관련 언급보다, 저출산의 현상이 나타나게 된 배경에는 개인 가치관의 변화에 따른 선택, 결혼이나 임신, 출산과정에 대한 불안 및 걱정 등이 주로 등장하고 있음을 발견하였다. 오신휘와 김혜진(2020)은 텍스트마이닝 기법을 통해 2006년부터 2020년까지 저출산과 관련된 학술문헌 752개 를 수집하여, 동시출현단어 분석기법을 활용하여 저출산 정책의 시기별 네트워크 분석을 실시하였다. 기존 연구에서의 학술문헌 중심 접근과는 다르게, 본 연구는 뉴스기사의 빅데이터를 활용하였다는 점 에서 차이가 있으나 저출산‧고령사회 기본계획의 시기별로 구분해서 접근했다는 점에서는 유사하게 진 행되었다. 본 연구와 보다 유사하게 진행된 연구 가운데 노법래와 양경은(2019)은 2001년부터 2017 년까지의 저출산 키워드를 통해 웹에서 수집한 기사 약 7만건을 텍스트마이닝 및 토픽모델링 기법을 활 용하여 저출산 논의에 대해 위기, 대응, 적응의 의미군집이 존재하고 있음을 밝혀내었다.
본 연구에서는 저출산‧고령사회 기본법이 제정된 2005년 이후, 기본 계획이 5개년 단위로 등장하게 된 2006년부터 2023년 현재까지 약 20여년에 가까운 기간 동안 ‘저출산’과 ‘출산율’ 키워드를 중심으로 생성된 언론 기사를 수집하고자 한다. 학술 문헌이나 소셜미디어가 아닌 사회적 현상과 흐름을 반영한 기사를 통해, 기본 계획의 시기별로 저출산에 대해 어떠한 담론이 오고갔는지, 장시간에 걸쳐 저출산 연관 키워드는 어떻게 구성되는지 분석하고자 한다. 그간 저출산 문제를 해결하고자 관련하여 다양한 정책과 제도가 수반되었음에도 불구하고 실제 출산율 제고로 이어지는 것은 미진한 상황이었기에, 4차 저출산‧고령사회 기본계획이 중반부에 이른 현 시점에서 저출산 키워드를 중심으로 한 뉴스 빅데이터를 살펴보고자 하는 것이다. 뉴스 미디어 내에서 저출산의 문제가 어떻게 다루어지는지 뉴스 키워드 간 관 계도 분석, 키워드 트렌드 및 상관관계, 키워드의 연관어 분석 등을 통해, 저출산 현상과 관련한 우리 사회의 담론을 실증적으로 살펴보고자 한다. 본 연구와 같이 저출산 현상에 대해 탐색적으로 접근하는 키워드 및 트렌드 분석을 기반으로, 향후 제도 및 정책에 대한 심층적이고 구체적인 평가를 실시하기 위한 토대를 마련하고자 한다. 이를 위한 본 연구의 연구문제는 다음과 같다.
-
연구문제 1. 국내 언론보도에서 나타난 저출산‧고령사회 기본계획 시기별 주요 키워드는 무엇인가?
-
연구문제 2. 국내 언론보도에서 저출산, 출산율 키워드를 중심으로 저출산‧고령사회 기본계획 흐름 에 맞게 연관 키워드들은 어떻게 변화하는가?
Ⅱ. 연구방법
1. 분석 자료
본 연구를 위한 자료 수집은 한국언론진흥재단에서 제공하는 기사 데이터베이스인 빅카인즈를 활용 하여, ‘저출산’, ‘출산율’의 키워드를 포함하는 뉴스 기사를 수집하였다. 기간은 연구의 목적에 따라 다르 게 설정하였으나, 기사를 추출하기 위한 언론사는 11개의 전국일간지(경향신문, 국민일보, 내일신문, 동아일보, 문화일보, 서울신문, 세계일보, 조선일보, 중앙일보, 한겨례, 한국일보), 8개의 경제일간지 (매일경제, 머니투데이, 서울경제, 아시아경제, 아주경제, 파이낸셜뉴스, 한국경제, 헤럴드경제), 5개 방송사(KBS, MBC, OBS, SBS, YTN) 그리고 2개의 전문지(디지털타임스, 전자신문)로 지정하였다.
전반적으로 ‘저출산’, ‘출산율’에 대한 키워드를 중심으로 트렌드의 변화를 살펴보지만, 연구 문제에 대해 구체적으로 살펴보기 위해 제1차 저출산‧고령사회 기본계획이 도입된 2006년부터 2010년, 제2 차 기본계획이 시행된 2011년~2015년, 제3차 기본계획이 운영된 2016년~2020년, 그리고 최근 도 입되어 진행 중인 제4차 기본계획은 2021년부터 현재까지로 구분하여 해당 시점에 따른 언론사에서의 저출산, 출산율 키워드가 어떠한 흐름으로 나타나는지 파악해보고자 한다.
우선 저출산‧고령사회 기본계획이 시작된 2006년부터 2023년 10월 현재까지의 전국일간지, 경제일 간지, 방송사, 전문지에서 ‘저출산’, ‘출산율’의 키워드를 투입하되, 다양한 섹션 중에서도 정부 또는 정 계의 메시지가 아닌(정치면 제외), 정책에 대한 대중의 반응을 살필 수 있는 ‘경제, 사회’면을 중심으로 크롤링하였다. 데이터베이스를 통해 추출한 뉴스 검색결과는 총 89,501건이었으나 반복되는 기사, 부 고, 동정 및 인사 등 예외기사를 제외하면 분석에는 85,682건이 활용되었다.
2. 분석 방법
본 연구의 분석 과정은 앞서 서론에서 제시한 바와 같이 키워드 간의 관계도 분석, 트렌드 분석, 그리 고 연관어 검색을 수행하게 된다. 관계도 분석의 경우 추출된 기사 가운데 정확도가 높은 상위 100건의 뉴스에서 추출된 형태소를 분석하여 명사 상당어구를 추출한다. 추출된 명사 상당어구에 개체명 분석 알고리즘(Structured Support Vector Machine)을 적용하여 개체명의 관련 기사 건수를 고려하여 가 중치를 부여한다. 가중치(관련 기사 건수)를 조절하여 표출되는 개체명(키워드, 인물, 기관, 장소) 사이 의 연결 관계에 대해 네트워크의 형태로 분석하는 것이 관계도 분석이다.
키워드의 트렌드 분석은 빈도분석과 유사하다. 정해진 기간동안 얼마나 해당 키워드가 자주 등장했 는지 전반적인 흐름을 살펴보는 것이다. 다만 차이가 있다면, 본 연구를 통해 살펴보고자 하는 두 가지 의 키워드(저출산, 출산율)를 함께 살펴봄으로써 두 키워드간의 상관관계도 동시에 파악하고자 한다. 상관계수는 두 키워드 사이의 상관관계의 정도를 나타내는 수치로 본 연구에서는 피어슨 상관계수 (Pearson correlation coefficient, Pearson's r)를 사용한다.
마지막으로 연관어 분석은 토픽랭크 알고리즘을 기반으로 시맨틱 네트워크를 구성하여 워드 클라우 드의 형태로 결과물을 얻게 되는 방법인데, 토픽랭크는 투입한 키워드를 통해 검색한 결과에 대한 공시 적 분석과 워드 클러스터링을 하여 동적으로 상호작용하는 시맨틱 네트워크를 생성하는 알고리즘이다. 본 분석에서 활용한 토픽랭크 알고리즘은 동시출현단어들의 빈도 정도를 반영하여 주요한 단어를 추출 하는 TF-IDF를 기반으로 하고 있다. TF-IDF(Term Frequency-Inverse Document Frequency) 는 여러 문서로 이루어진 문서집단이 있을 때, 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치로 문서의 핵심어를 추출하거나 문서들 사이의 비슷한 정도를 구하는 상황에서 활용된다(Aizawa, 2003;Lee & Cheon, 2010;Zhang, Yoshida & Tang, 2011).
Ⅲ. 연구결과
1. 저출산‧고령사회 기본계획 이후 추출에 따른 뉴스 트렌드
‘저출산’과 ‘출산율’이라는 키워드를 제1차 저출산‧고령사회 기본계획이 시작된 2006년도부터 제4차 기본계획이 시작되어 진행되고 있는 2023년 10월 현재까지 전국일간지, 경제일간지, 방송사, 전문지 에서 경제/사회면을 중심으로 추출했을 때 89,501건이 등장하였고 연도별로 그 흐름을 보면 다음 <그 림 1>과 같다.
제1차 저출산‧고령사회 기본계획이 시작된 2006년도부터 2010년까지 등장한 뉴스의 개수는 15,765건, 제2차 저출산‧고령사회 기본계획이 시작된 2011년도부터 2015년까지 나타난 뉴스는 20,620건, 제3차 저출산‧고령사회 기본계획이 시작된 2016년도부터 2020년까지 등장한 뉴스의 개수 는 32,450건이며, 현재 제4저출산‧고령사회 기본계획이 시작된 2021년도부터 2023년 10월까지는 5 개년 계획 중 절반가량 지나왔으나 이미 20,666건에 달했다. 매회차 기본계획이 거듭될수록 저출산 현 상에 대한 관심과 출산율에 대한 지적을 다룬 뉴스는 지속적으로 증대하고 있음을 알 수 있었고, 아직 4차 기본계획이 진행중이며 본 연구를 통해 뉴스를 취합한 시점이 중반부라는 점을 감안하더라도 향후 저출산 및 출산율에 대한 뉴스는 지속적으로 증가할 것으로 보인다.
2. 제1차 저출산‧고령사회 기본계획(2006~2010) 시기의 트렌드
‘저출산’과 ‘출산율’이라는 키워드를 제1차 저출산‧고령사회 기본계획이 시작된 2006년도부터 2010 년까지 전국일간지, 경제일간지, 방송사, 전문지 기준 경제/사회 섹션을 중심으로 크롤링했을 경우, 15,765건이 추출되며 반복 및 예외기사를 제외하면 15,055건이 분석에 활용되었다. 상위 100건의 뉴 스를 추출하여 개체명(인물, 장소, 기관, 키워드) 사이의 연결 관계를 네트워크 형태로 나타낸 결과는 아래 <그림 2>와 같으며, 뉴스의 기사제목 뿐 아니라 본문의 형태소를 분석하여 명사상당어구를 추출 한 것이다. 관계도 분석결과 1위는 통계청(가중치 18), 2위는 OECD(가중치 16), 3위는 프랑스(가중치 16)의 순으로 파악되었다. 아래 4가지 색으로 단어들이 뭉쳐있는 것은 키워드, 인물, 기관, 장소를 중 심으로 어떤 단어들이 주로 등장했는지를 나타내는 것이다.
제1차 저출산‧고령사회 기본계획 기간에 해당되는 2006년부터 2010년까지 ‘저출산’, ‘출산율’의 두 가지 키워드가 어떻게 월별로 등장하는지 살펴본 결과는 아래의 <그림 3>에 나타난 바와 같다. ‘저출산’ 은 파란색으로 제시하였으며, 2010년 9월 607건으로 가장 많이 등장하였고 이어서 2009년 12월에 498건, 2010년 3월에 463건 보고되었다. ‘출산율’의 경우 빨간색으로 제시된 꺾은 선으로, 2006년 5 월에 가장 많은 249건이 등장하였다. 이어서 2009년 11월에 213건, 2006년 6월 202건으로 나타났으 며 대체로 기본계획의 시작과 끝에 빈번하게 등장함을 알 수 있다. 두 가지의 키워드 간 상관계수는 0.6322로 뚜렷한 양적 선형관계를 지니고 있음을 파악하였다.
2006년부터 2010년까지 ‘저출산’, ‘출산율’ 키워드를 투입했을 때 추출된 뉴스와 연관성(가중치 및 키워드 빈도수)이 높은 연관어를 보여주는 TF-IDF 기반 클러스터링 분석 결과는 <그림 4>에 보고하 였다. 해당 워드 클라우드는 1,000건의 뉴스를 분석했을 때 나타난 결과로, 가중치를 기준으로 한 키워 드의 순위는 ①고령화(가중치 163.79), ②우리나라(가중치 160.95), ③세계 최저 수준(가중치 110.71), ④고령사회(가중치 64.30), ⑤통계청(가중치 63.95)의 순으로 나타났다. 단순 기사에서 등 장하는 키워드 빈도수를 기준으로 한 순위는 ①고령화(893회), ②우리나라(783회), ③고령사회(445 회), ④프랑스(394회), ⑤여성들(366회) 순으로 확인되었다. 저출산과 출산율의 키워드와 관련해서 고 령화 및 고령사회라는 우리나라가 처한 상황은 가중치나 빈도수로 비교하더라도 크게 차이는 없었다. 그러나 빈도수로 살펴보았을 때 새롭게 등장한 ‘프랑스’와 ‘여성들’ 이라는 키워드는 프랑스에서 여성들 을 위한 출산 장려 및 육아 지원 정책과 관련된 기사가 다수 보도되었음을 알 수 있다.
3. 제2차 저출산‧고령사회 기본계획(2011~2015) 시기의 트렌드
제2차 저출산‧고령사회 기본계획이 수행된 기간인 2011년부터 2015년까지 ‘저출산’과 ‘출산율’ 키워 드가 얼마나 등장했는지 전국일간지, 경제일간지, 방송사, 전문지 기준 경제/사회 섹션을 중심으로 크 롤링 한 결과, 20,620건이 추출되었고 반복 및 예외 기사를 제외하여 19,678건이 분석에 활용되었다. 상위 100건의 뉴스를 추출하여 개체명(인물, 장소, 기관, 키워드) 사이의 연결 관계를 네트워크 형태로 나타낸 결과는 아래 <그림 5>와 같다. ‘저출산’, ‘출산율’에 대한 관계도를 분석한 결과, 1위는 OECD (가중치 45), 2위로 보건복지부(가중치 35), 3위는 한국보건사회연구원(가중치 20)으로 파악되었다. 제2차 기본계획 시기와 관련하여 해외 국가들과의 출산율 비교를 위해 OECD가 자주 등장하였고 출산 장려 및 육아지원과 관계된 주무부처인 보건복지부 및 정부출연 연구기관으로 한국보건사회연구원이 자주 등장한 것으로 사료된다.
제2차 저출산‧고령사회 기본계획 기간인 2011년터 2015년까지 ‘저출산’, ‘출산율’ 두 가지 키워드가 월별로 어떻게 나타나는지 살펴본 결과는 <그림 6>에 제시되었다. ‘저출산’은 파란색의 꺾은선으로 2015년 12월 817건으로 가장 많이 등장하였다. 이어서 2014년 11월에 563건, 2015년 10월에 491건 순으로 나타났다. ‘출산율’은 빨간색 꺾은선으로 나타냈으며 2014년 11월에 321건이 가장 빈번하게 등장한 결과이다. 또한 2015년 12월에 284건, 2015년 2월에 248건의 순으로 출산율에 대한 키워드 가 나타났다. 대체로 저출산에 대한 키워드는 기본계획 기간의 시작 시점에, 그리고 마무리가 되어가는 ‘14년 ’15년 연말에 주로 빈번하게 등정하는 것으로 파악된다. 출산율에 대한 언급도 붉은 그래프를 통 해 비슷한 흐름으로 진행되는 것을 알 수 있다. 두 키워드 간의 상관계수는 0.6852로 뚜렷한 양적인 선 형관계를 보이는 것으로 파악되었다.
제2차 저출산‧고령사회 기본계획 기간에 ‘저출산’, ‘출산율’ 키워드를 투입했을 때 추출된 뉴스와 연관 성(가중치 및 키워드 빈도수)이 높은 연관어를 보여주는 TF-IDF 기반 클러스터링 분석 결과는 <그림 7>에 제시하였다. 워드 클라우드로 표현된 결과는 관련 정확도가 높은 1,000건의 뉴스를 분석했을 때 나타난 결과로, 좌측은 가중치를 기준으로 한 결과이다.
키워드의 순위는 ①고령화(가중치 178.25), ②우리나라(가중치 169.6), ③OECD(가중치 109.59), ④고령사회(가중치 92.16), ⑤보건복지부(가중치 75.72)의 순으로 보고되었다. 유사하지만 다소 차이 가 있는 빈도순으로 워드 클라우드를 정렬한 결과는 우측에 제시되었고 기사에서 등장하는 키워드의 빈도수를 기준으로 한 순위에서는 ①고령화(941회), ②우리나라(871회), ③일자리(624회), ④육아휴 직(611회), ⑤고령사회(525회) 순으로 나타났다.
가중치와 빈도수에서 높은 순서로 보고된 키워드 간의 차이를 살펴보면, 빈도수에서 처음으로 ‘일자 리’와 ‘육아휴직’이라는 단어가 등장했다는 점이다. ‘저출산’ 혹은 ‘출산율’과 높은 연관성으로 고려되는 키워드가 ‘일자리’, ‘육아휴직’과 같이 직장 및 경제활동과 직결된다는 점이 인상적이다. 출산을 고려했 을 때 현재 일하던 직장에서 육아휴직을 사용하거나, 복귀하는 것이 가능한지에 대한 일자리의 안정성 이나 경력 단절과 같은 우려로 인해 일자리, 육아휴직이 함께 연관어로 파악된다는 점은 후술할 논의 부분에서 다시 한 번 다루겠지만 매우 중요한 시사점으로 볼 수 있다. 2차 기본계획은 일과 가정의 양립 일상화라는 아젠다를 가장 첫 번째로 내걸고 육아를 위한 휴가‧휴직 제도의 확대 및 개선, 유연한 근무 의 형태 확산, 가족친화적인 직장 및 사회 환경을 세부 목표로 잡은 바 있기에 그러한 부분들이 함께 저 출산, 출산율과 연관어로 빈번하게 등장한 것으로 사료된다.
4. 제3차 저출산‧고령사회 기본계획(2016~2020) 시기의 트렌드
제3차 저출산‧고령사회 기본계획이 시행된 2016년부터 2020년까지 ‘저출산’과 ‘출산율’ 키워드가 얼 마나 나타났는지 파악하기 위해, 전국일간지, 경제일간지, 방송사, 전문지의 경제/사회 섹션을 중심으 로 크롤링 한 결과, 32,450건이 추출되었다. 반복 및 예외기사를 제외하고 31,054건이 분석에 활용되 었다. 관계도 분석은 크롤링한 결과 중 추출된 상위 100건의 뉴스에서 개체명(인물, 장소, 기관, 키워 드) 사이의 연결을 네트워크 형태로 나타낸 결과로 <그림 8>과 같다. 관계도 분석 결과, 1위는 통계청 (가중치 38), 2위는 OECD(가중치 38), 그리고 3위는 대통령(가중치 16)의 순으로 파악되었다. 앞서 2 차 기본계획 기간에는 기관들만 등장한 것과 달리, 3차에서는 처음으로 대통령이 강조되었다. 박근혜 대통령에서 문재인 대통령으로 대통령이자 위원장이 바뀐 시기이기도 하고 실제로 문재인 정부는 취임 첫 해 ‘일하며 아기 키우기 행복한 대한민국’ 간담회를 개최하여 3차 기본계획 기간에는 사회구조적인 접근으로 저출산 문제를 해결하고자 하는 의지가 강했다고 평가되고 있다.
제3차 저출산‧고령사회 기본계획이 시행되었던 2016년부터 2020년까지 ‘저출산’, ‘출산율’ 두 가지 키워드가 어떻게 월별로 등장했는지 살펴본 결과는 <그림 9>와 같다. ‘저출산’은 파란색 꺾은선으로 표 현했으며 2018년 3월에 740건으로 가장 많이 등장하였다. 이어 2018년 8월 727건, 2018년 7월 704 건 순으로 확인되었다. 하단의 빨간 꺾은선은 ‘출산율’의 등장을 의미하는데, 2019년 3월에 312건이 가장 빈번하게 나타난 것이고, 이어서 2018년 8월에 298건, 2018년 3월과 7월에 동일하게 276건 등 장하였다. 저출산과 출산율의 두 키워드 간 상관계수는 0.6837로 이는 뚜렷한 양적 선형관계를 의미하 며 실제로 두 그래프를 보면 상당히 유사한 패턴으로 흘러가고 있음을 알 수 있다.
제3차 저출산‧고령사회 기본계획 기간에 ‘저출산’, ‘출산율’ 키워드를 투입했을 때 추출된 뉴스와 연관 성(가중치 및 키워드 빈도 수)이 높은 연관어를 보여주는 TF-IDF 기반 클러스터링 분석 결과는 <그림 10>에 제시하였다. 워드 클라우드는 1,000건의 뉴스를 분석했을 때 나타난 결과로, 가중치를 기준으 로 한 키워드의 순위는 ①우리나라(가중치 126.38), ②고령화(가중치 122.38), ③출생아(가중치 119.72), ④통계청(가중치 101.96), ⑤OECD(가중치 100.5)의 순으로 보고되었다. 기사에서 등장하 는 키워드의 빈도수를 기준으로 한 순위에서는 ①출생아(1,406회), ②우리나라(884회), ③고령화(820 회), ④고령사회(751회), ⑤통계청(720회) 순으로 나타났다.
5. 제4차 저출산‧고령사회 기본계획(2021~2025) 시기의 현재 진행 트렌드
제4차 저출산‧고령사회 기본계획이 시행된 2021년부터 2023년 10월 현재까지의 ‘저출산’과 ‘출산율’ 키워드가 어떻게 나타났는지 파악하기 위해, 전국일간지, 경제일간지, 방송사, 전문지의 경제/사회 섹 션을 중심으로 추출하여 20,666건이 추출되었다. 반복 및 예외기사를 제외하면 19,895건이 분석에 활 용되었다. 가장 먼저 수행한 관계도 분석은 크롤링한 결과 중 추출된 상위 100건의 뉴스에서 개체명(인 물, 장소, 기관, 키워드) 사이의 관계를 네트워크 형태로 나타낸 결과로 <그림 11>과 같다. 관계도 분석 의 결과, 1위는 OECD(가중치 50), 2위로는 통계청(가중치 39), 3위는 대통령(가중치 18)의 순으로 파 악되었고, 4차 기본계획에서도 저출산‧고령사회 위원장인 대통령에 대한 언급이 다수 나타남을 알 수 있었다.
제4차 저출산‧고령사회 기본계획이 도입된 2020년부터 현재 2023년 10월까지 ‘저출산’, ‘출산율’ 두 개의 키워드가 월별로 어떻게 등장했는지 <그림 12>에 나타난 바와 같이 트렌드를 살펴볼 수 있다. ‘저 출산’은 파란색의 꺾은선으로, 2023년 3월에 1,157건으로 가장 많이 나타났으며 이어서 2023년 7월 에 928건, 2023년 6월 915건의 순으로 등장하였다. 빨간색의 꺾은선은 ‘출산율’을 의미하며 2023년 3 월에 ‘저출산’과 동일하게 가장 많이 나타나 537건으로 보고되었다. 이어 2023년 5월에 369건, 2023 년 2월에 361건으로 확인되었다. 저출산 및 출산율 두 키워드 간의 피어슨 상관계수는 0.6969로 뚜렷 한 양적의 선형관계를 갖는 것으로 파악되었다.
제4차 저출산‧고령사회 기본계획이 도입된 이후로 현재에 이르기까지 ‘저출산’, ‘출산율’ 키워드를 투 입했을 때 추출된 뉴스와 관련성(가중치 및 키워드 빈도수)이 높은 연관어를 보여주는 TF-IDF 기반의 클러스터링 분석을 한 결과는 <그림 13>에 제시되었다. 1,000건의 뉴스를 분석했을 때 나타난 워드 클 라우드 결과로, 가중치를 기준으로 한 순위는 ①고령화(가중치 122.72), ②우리나라(가중치 120.78), ③OECD(가중치 111.09), ④출생아(가중치 108.18), ⑤역대최저(가중치 86.3)의 순으로 나타났다. 기사에 등장하는 키워드의 빈도수를 기준으로 살펴본 순위에서는 ①출생아(1,072회), ②육아휴직(920 회), ③우리나라(743회), ④OECD(738회), ⑤고령화(638회) 순으로 보고되었다. 연관어 검색에서 가 중치 부여 순으로나, 빈도수 순에서도 출생아와 역대 최저가 함께 등장했고 빈도수 순의 단어 중에 육 아휴직이 다시 한번 등장했다는 부분은 상당히 고려해야 할 부분이라고 판단된다.
6. 1990년~현재까지의 ‘저출산’, ‘출산율’ 뉴스 빅데이터 및 키워드 트렌드
논의 및 결론을 작성하기에 앞서, 뉴스에 대한 데이터베이스가 축적되기 시작한 1990년대부터 현재 에 이르기까지 ‘저출산’, ‘출산율’ 뉴스를 추출했을 경우 흐름이 어떻게 나타나는지 살펴보고자 키워드 트렌드 분석을 수행하였다. 그 흐름은 <그림 14>에 제시하였고, 앞서 연구에서 수행한 것과 동일하게 전국일간지와 경제일간지, 방송사, 전문지를 대상으로 경제/사회면을 중심으로 크롤링하였고, 추출된 뉴스는 총 94,693건으로 나타났다.
다수의 선행연구에서도 보고한 바와 같이, 저출산 현상에 대해 정부가 공식적인 대응을 시작한 것은 2003년으로 보고된다(뉴스건수 688건). 그러다 2005년에 들어서면서 정부는「저출산・고령사회기본 법」을 제정하고 이후 기본계획에 대해 추진한다. 저출산 현상을 해결하기 위한 본격적인 국가 정부 주 도의 개입이 시작되는 시점이라고 볼 수 있는 2004년에는 1,087건, 그리고 법안이 제정된 2005년에 는 2,167건으로, 언론에 저출산 및 출산율이라는 키워드가 노출되는 횟수 역시 급증하는 것을 알 수 있 다. 5개년의 단위로 기본계획이 진행되는 동안 기사가 얼마나 등장했는지 끊어서 살펴본다 하더라도 1 차와 2차에는 기본계획이 수립되는 시점과 종료되는 시점에 기사의 수가 늘어났고, 3차의 경우 예외적 으로 5개년 계획이 진행되는 기간 중 2018년이 가장 두드러졌는데, 우리나라가 고령사회에 진입한 시 점이기 때문에 함께 저출산의 이슈가 다뤄졌기 때문으로 추측할 수 있다.
1990년부터 현재에 이르기까지 ‘저출산’, ‘출산율’의 두 가지 키워드가 연도별로 어떻게 등장하는지 연간 흐름을 살펴본 결과는 아래의 <그림 15>에 제시하였다. ‘저출산’의 경우 파란색으로 제시된 꺾은 선으로 2023년에 7,741건으로 가장 많이 등장하였고, 다음으로 2018년에 6,673건, 이어서 2017년 에 6,177건으로 나타났다. 아직 1년이 채 마무리 되지 않았으나, 2023년 올해 저출산을 지적한 건수가 가장 많고, 우리나라가 고령사회에 진입한 시점인 2018년, 그리고 그 전년도 순으로 나타났다고 볼 수 있다. ‘출산율’의 경우 빨간색의 꺾은 선으로, 저출산 키워드와 동일하게 2023년에 3,396건으로 가장 빈번하게 나타났고, 2018년에 2,396건, 이어서 2017년에 2,210건으로 유사한 패턴을 보여주고 있었 다. 실제로 두 가지의 키워드 간 상관계수가 0.7104로 나타나 그간 살펴보았던 상관관계보다 매우 강 한 양적 선형관계를 지니고 있음을 알 수 있었다.
Ⅳ. 논의 및 결론
제4차 저출산‧고령사회 기본계획은 2021년 시작되어 2023년에는 중반부를 지나가고 있다. 앞서 15 년간 3번의 저출산‧고령사회 기본계획이 시행되었음에도 아직까지 우리 사회는 초저출산의 문제를 심 각하게 겪고 있다. 저출산‧고령사회 기본계획 시기별로 국내 언론에서 보도된 주요 키워드가 무엇인지 살펴보고자 한 연구문제 1에 대한 해답을 찾자면 앞서 1차 기본계획에서는 영유아 보육 및 교육의 확대 로 양육에 대한 사회적 책임을 강화하고, 2차에서는 육아휴직 및 무상보육 실시 등 소기의 성과를 이루 었다. 2차 기본계획이 진행되던 시기는 본 연구의 TF-IDF 분석의 결과에서도 일자리와 육아휴직에 대 한 키워드가 의미 있게 등장한 시점이기도 하다. 특히 2019년에는 제3차 저출산‧고령사회 수정 기본계 획을 마련하면서 저출산에 대한 패러다임을 단순 출산율 제고에서 사회구조적 원인을 해결하는 방안으 로 확대하였다. 본 연구결과에서도 키워드의 관계도 분석에 있어, 저출산고령사회위원장인 대통령이 처음으로 등장하였다. 그러나 3차에서는 청년세대의 삶의 질을 고려하는 종합적인 대응으로 확장했음 에도 불구하고 합계출산율이 1명 아래로 떨어지면서 저출산 정책에 대한 효과성에 대해서는 ‘실패’라는 분석이 지배적이기도 하다.
2005년 법이 제정된 이후로 정부는 ‘출산율’을 높이기 위해 약 300조에 달하는 엄청난 예산을 쏟아 부었지만 저출산에 대한 문제 해결은 아직도 갈피를 잡지 못하고 있는 듯하다. 청년세대에게 결혼과 출 산이라는 부분이 통과의례적인 사회적 규범이 아니라, 선택이 된 상황이기 때문에 삶의 질을 고려한 실 질적인 지원책을 고민해야 장기적인 관점에서 대응이 가능할 것이다. 대통령 직속 저출산고령사회위원 회(2023)의 자료에 따르면, 2006년부터 2010년 1차 기본계획 기간동안 약 20조에 달하는 비용이 정 책에 투입되었고, 2차 기본계획 기간(2011년~2015년)에는 1차의 3배가 넘는 60조가 투입되었다. 3 차 기본계획 기간(2016년~2020년)에는 152조 8658억이 투입되었으며, 2021년부터 4차 저출산‧고 령사회 기본계획이 시작되는데 그 한 해에만 정책 대응을 위해 46조 6846억이 집행되었다. 그러나 아 이러니하게도, 4차 기본계획이 진행되고 있는 시점에서, TF-IDF 기반의 클러스터링 분석을 한 결과 는 ‘출생아, 역대최저, 육아휴직’이 의미있는 키워드로 등장하였다. 단순히 수당과 같은 현금성으로 지 원하는 대책 그 이상의 정책이 마련되어야 할 것으로 사료된다. 키워드의 변화 흐름에 대해 살펴보고자 한 연구문제 2와 같이, 저출산 현상이 지속되는 원인에 대해 출산 및 육아에 대한 부담, 일-가정 양립 의 어려움, 고용불안 및 주거 부담 등 핵심적인 난제가 근본적으로 해결되지 않고 있기 때문이라는 해 석이 따르는데, 본 연구의 키워드 트렌드 분석 결과에서 고용 불안, 육아와 일-가정 양립을 포괄하는 키워드가 지속적으로 등장하는 것이 이를 반증하고 있다.
기본계획 시기별 제시된 주요 결과에 기초하여 정책에 대한 실천적 제언을 하면 다음과 같다. 첫째, 노동 중심의 생애과정을 중요하게 인식하여, 정책의 수요자 관점에서의 접근과 평가가 필요하다. 과거 Esping-Andersen(2002)은 여성 고용의 확대가 탈산업사회의 안정을 유지하는 핵심 요소임을 지적 하면서, 고용과 모성이 조화를 이루지 못하면 심각한 노동 공급의 부족이 발생하거나, 출산율 감소로 이어지는 결과를 초래할 것이라고 경고한 바 있다. 소득의 증가와 함께 소비 수준이 향상된 가운데, 여 성의 학력 수준 상승과 다양한 분야로의 사회/경제적 참여, 자아실현의 욕구 증가 등이 복합적으로 작 용하여 결혼을 한 이후에도 직장생활을 유지하는 여성의 비율이 높아졌다. 그러나 앞서 살펴보았던 워 드 클라우드의 연관어 분석에서도 등장했듯이 ‘프랑스, 여성, 육아휴직, 일자리’라는 키워드가 빈번하 게 언급된 것은 매우 중요한 의미가 있다고 볼 수 있다. 현재의 청년세대는 남녀를 막론하고 출산과 양 육에 대해 제도적인 기반이 충분히 마련되지 않는다면, 출산에 대한 결정을 쉽게 바꾸지 않을 것이라고 밝힌 바 있다(김은지 외, 2020). 출산율 반등에 성공한 유럽 국가의 사례를 보다 면밀히 살펴봄으로써, 결혼 이후에도 경제활동을 하며 본인의 커리어를 유지하고 싶지만 출산 및 육아로 인해 고용에 대한 불 안정성을 느끼거나, 출산 이후 육아휴직을 사용해도 되는지에 일자리에 대한 불안감이 잔존하는 여성 의 상황에 보다 집중함으로써 수요자 관점에서의 정책 수립이 필요하다.
다음으로, 전반적인 사회 환경 및 기업 문화 개선을 통해 저출산 현상 문제 해결에 대한 장기적인 대 응이 요구된다. 2021년 8월 발간된 ‘저출산 대응 사업 분석‧평가’ 보고서에서는 출산 지원금이나 교육 및 보육비, 아동 수당 지원 등을 통한 단기적인 대응이 아니라, 고물가의 경제 위기 및 높은 집값 상승, 자녀 사교육비에 대한 높은 부담, 청년 실업률 등 장기적으로 사회‧경제 구조적인 문제에 대해 거시적으 로 접근할 필요가 있다고 보고된다(국회예산정책처, 2021). 저출산과 관련하여 표면적으로 드러나는 문제에만 집중할 것이 아니라, 복잡다단하게 얽혀있지만 그럼에도 불구하고 원인으로 진단되는 부분에 대해 청년세대의 문화 가치적인 부분까지 고려하여 어떻게 개선해 나아가야 할 지에 함께 고민해야 할 것이다. 제4차 기본계획에서는 함께 일하고 함께 돌보는 사회로의 전환을 위해 일‧생활 균형을 실현할 수 있는 사회적 분위기를 조성하겠다고 밝혔다(대한민국정부, 2020). 남녀 모두의 역량이 고루 발휘되 는 사회를 만들고자, 특히 여성의 경력유지 및 성장 기반을 강화하겠다는 목표도 제시하였다. 실제로 얼마나 많은 임산부 및 배우자가 육아휴직을 사용할 수 있는지, 실태조사만 확인하더라도 아직까지는 육아휴직에 대해 주변의 눈치를 보지 않을 수 없는 상황이다. 결혼이나 출산, 육아 등의 이슈로 여성 고 용을 망설이지 않는 기업, 육아휴직을 권장하는 기업, 나아가 육아휴직 대체인력에 대한 준비가 된 기 업들은 얼마나 되는지 이러한 기업에 대해서는 인센티브나 국가 차원에서의 지원이 요구된다. 출산과 육아를 지원하는 사회문화적 인식이 15년 이상 투입된 정책과 예산 대비 얼마나 이루어졌는가에 대한 신랄한 평가가 필요한 시점이다.
본 연구는 위와 같은 논의를 다루었음에도 다음과 같은 제한점을 갖는다. 저출산과 출산율이라는 유 사 키워드 중심으로 경제/사회면의 뉴스 빅데이터를 활용하였기 때문에, 해외 다른 국가들과의 비교가 이루어지는 국제면 혹은 정부 및 정당 주도의 정치면에서 다루어지는 기사들에 대한 상세한 파악은 이 루어지지 못했다. 그럼에도 본 연구는 장기간 걸친 대규모의 뉴스 빅데이터를 활용하여 텍스트 마이닝 기법을 통해 사회정책에 적용해 본 의미 있는 시도라고 사료된다. 다만 기계적인 과정에 의존하기보다, 알고리즘에 입각하여 자료를 분석하더라도 도출된 결과를 통해 근거 기반의 정책 비판과 효과성 개선 에 대해 함의를 도출할 수 있는 연구로서 기여하고, 향후 후속연구로는 실제 청년세대를 대상으로 질적 분석과 논의도 이어질 수 있기를 희망한다.