Java

JVM

GongCho 2025. 2. 27. 12:05

Java21의 Virtual Thread에 대해 공부하던 중, VM 스레드라는 용어가 나왔다. 자주 접하는 용어이지만, 더 깊이 학습하고자 작성하게 되었다.

Platform Thread (플랫폼 스레드)는 OS 스레드를 래핑 하여 구현한 JVM 스레드

 

Java Virtual Machine의 줄임말.

직역하면, ‘자바를 실행하기 위한 가상 기계’라고 할 수 있다.

Java는 OS에 종속적이지 않다는 특징을 가지고 있다. OS에 종속받지 않고 실행되기 위해선 OS위에서 Java를 실행시킬 무언가가 필요하다. 그게 바로 JVM이다.

즉, OS에 종속받지 않고 CPU가 Java를 인식, 실행할 수 있게 하는 가상 컴퓨터이다.

Java 소스코드, 즉 원시코드(*.java)는 CPU가 인식을 하지 못하므로 기계어로 컴파일을 해줘야한다.

하지만 Java는 이 JVM이라는 가상머신을 거쳐서 OS에 도달하기 때문에, OS가 인식할 수 있는 기계어로 바로 컴파일되는게 아니라 JVM이 인식할 수 있는 Java Bytecode(*.class)로 변환된다.

Java compiler가 .java파일을 .class라는 Java bytecode로 변환한다.

여기서 Java compiler는 JDK를 설치하면 bin에 존재하는 javac.exe를 말한다. 즉, JDK에 Java compiler가 포함되어있다는 소리임 javac명령어를 통해 .java를 .class로 컴파일할 수 있다.

변환된 bytecode는 기계어가 아니기때문에 OS에서 바로 실행되지 않는다.

이때, JVM이 OS가 bytecode를 이해할 수 있도록 해석해준다. 따라서, Bytecode는 JVM위에서 OS에 상관없이 실행될 수 있는것이다.

OS에 종속적이지 않고, Java파일을 하나 만들면 어느 디바이스든 JVM위에서 실행할 수 있다.


컴파일 하는 방법

아래는 Java Compiler에 의해, .java파일을 .class라는 Java bytecode로 만드는 과정이다.

Java Compiler는 JDK를 설치하면, JDK의 bin폴더에 javac.exe로 존재한다.

Java Compiler의 javac라는 명령어를 사용하면 .class파일을 생성할 수 있다.

예제

public class test {
	public static void main(String[] args) {
		System.out.println("Hello World");
	}
}

“Hello World”를 출력하는 .java파일을 생성하고 이를 .class파일로 변환시켜보자.

C:\\Users\\owner>cd Desktop

Windows를 기준으로, cmd창을 열고 .java파일이 있는 곳으로 이동한다.

C:\\Users\\owner\\Desktop>javac test.java

해당 위치에서 javac명령어로 컴파일을 진행한다.

 

현재 위치에서 .class파일이 생성된 것을 확인할 수 있다.

이제, java명령어로 .class파일을 실행시켜보자.

C:\\Users\\owner>cd Desktop
C:\\Users\\owner\\Desktop>java test

.class파일이 위치한 곳으로 이동후, java [class파일 명]을 입력해 실행시킨다.

 

“Hello World”가 출력되면서 test.clas파일이 실행된 것을 확인할 수 있다.


바이트코드란 무엇인가

가상 컴퓨터에서 돌아가는 실행프로그램을 위한 이진 표현법

Java Bytecode는 JVM이 이해할 수 있는 언어로 변환된 자바 소스코드를 의미한다.

Bytecode는 다시 실시간 번역기 또는 JIT컴파일러에 의해 바이너리코드로 변환된다.

바이너리 코드란? 바이너리 코드 또는 이진코드라고 한다. 컴퓨터가 인식할 수 있는 0과 1로 구성된 이진코드

기계어란? 0과 1로 이루어진 바이너리 코드 기계어가 이진코드로 이루어졌을 뿐, 모든 이진코드가 기계어인것은 아니다. 기계어는 특정한 언어가 아니라, CPU가 이해하는 명령어 집합이며, CPU제조사마다 기계어가 다를 수 있다.

즉, CPU가 이해하는 언어는 바이너리코드, 가상머신이 이해하는 코드는 바이트코드이다.


JIT컴파일러란 무엇이며 어떻게 동작하는가?

JIT컴파일 또는 동적 번역이라고 한다.

JIT컴파일러는 프로그램을 실제 실행하는 시점에 기계어로 번역하는 컴파일러이다.

인터프리터 방식의 단점을 보완하기 위해 도입되었다.

인터프리터는 소스코드를 한 줄씩 또는 한 문장씩 읽고 실행하는 방식으로 동작한다. 즉, 프로그램 전체를 미리 기계어로 변환하는 것이 아니라, 실행 시점에 코드를 한줄씩 분석하고 실행한다.

인터프리터 방식으로 실행하다가, 적절한 시점에 바이트코드 전체를 컴파일하여 기계어로 변경하고 이후에는 해당 더이상 인터프리팅하지 않고, 기계어로 직접 실행하는 방식이다.

기계어는 캐시에 보관하기 때문에 한번 컴파일된 코드는 빠르게 수행하게 된다.

물론 JIT컴파일러가 컴파일하는 과정은 바이트코드를 인터프리팅하는 것보다 훨씬 오래걸리므로 한번만 실행되는 코드라면 컴파일하지 않고 인터프리팅하는 것이 유리하다.

자바에선, 자바 컴파일러가 자바 프로그램코드(.java)를 바이트코드(.class)로 변환한다음, 실제 바이트코드를 실행하는 시점에서 자바 가상머신이 바이트 코드를 JIT컴파일을 통해 기계어(바이너리 코드)로 변환한다.

 


JVM 구성요소

JVM은 크게 아래와 같이 이루어져있다.

  • Class Loader
  • Execution Engine
    • Interpreter
    • JIT Compiler
    • Garbage Collector
  • Runtime Date Area

Class Loader

JVM내로 클래스파일(*.class)을 로드하고, 링크를 통해 배치하는 작업을 수행하는 모듈이다.

런 타임시 동적으로 클래스를 로드하고 jar파일 내 저장된 클래스들을 JVM위에 탑재한다.

Execution Engine

클래스를 실행시키는 역할이다.

클래스 로더가 JVM내의 런타임 데이터 영역에 바이트 코드를 배치시키고, 이것은 실행 엔진에 의해 실행된다.

자바 바이트 코드(.class)는 기계가 바로 실행할 수 있는 언어보다는 비교적 인간이 보기 편한 형태로 기술된 것이다. 그래서 실행엔진은 이와 같은 바이트코드를 실제로 JVM내부에서 기계가 실행할 수 있는 형태로 변경한다.

  • Interpreter
    • 실행 엔진은 자바 바이트 코드를 명령어 단위로 읽어서 실행한다.
    • 하지만 한 줄씩 수행하기 때문에 느리다는 단점이 있다.
  • JIT
    • 인터프리터 방식으로 실행하다가 적절한 시점에 바이트 코드 전체를 컴파일하여 기계어로 변경하고, 이후에는 더이상 인터프리팅하지 않고 기계어로 직접실행하는 방식이다.
  • Garbage Collector
    • 더이상 사용되지 않는 인스턴스를 찾아 메모리에서 삭제함.

Runtime Data Area

프로그램을 수행하기 위해 OS에서 할당받은 메모리 공간

  • PC Register
    • Thread가 어떤 부분을 어떤 명령으로 실행해야할지에 대한 기록을 하는 부분으로 현재 수행중인 JVM명령의 주소를 갖는다.
  • JVM Stack
    • 프로그램 실행과정에서 임시로 할당되었다가 메소드를 빠져나가면 바로 소멸되는 특성의 데이터를 저장하기 위한 영역이다.
    • 메소드 안에서 사용되는 값들을 저장한다. 또, 호출된 메소드의 매개변수, 지역변수, 리턴 값 및 연산 시 일어나는 값들을 임시로 저장한다.
  • Native Method Stack
    • 자바 프로그램이 컴파일되어 생성되는 바이트코드가 아닌 실제 실행할 수 있는 기계어로 작성된 프로그램을 실행시키는 영역
    • Java가 아닌 다른 언어로 작성된 코드를 위한 공간?
    • Java Native Interface를 통해 바이트코드로 전환하여 저장하게 된다.
  • Method Area(=Class Area, Static Area)
    • 클래스 정보를 처음 메모리 공간에 올릴때 초기화되는 대상을 저장하기 위한 메모리 공간
  • Runtime Constant Pool
    • 스태틱 영역에 존재하는 별도의 관리영역
    • 상수 자료형을 저장하여 참조하고 중복을 막는 역할을 수행한다.
  • Heap

  • 객체를 저장하는 가상 메모리 공간
  • new연산자로 생성되는 객체와 배열을 저장한다.
  • Class Area에 올라온 클래스들만 객체로 생성할 수 있다.
  • Heap은 세부분으로 나뉘어진다.
    • Permanent Generation
      • 생성된 객체들의 정보의 주소값이 저장된 공간
    • New/Young Generation
      • 생명주기가 짧은 ‘젊은 객체’를 GC대상으로 하는 영역
      • Eden - 객체들이 최초로 생성되는 공간
      • Survivor 0,1 - Eden에서 참조죄는 객체들이 저장되는 공간
      • Eden영역에 객체가 가득차게 되면, 첫번째 GC가 발생한다.
      • Edend영역에 있는 값들을 Survivor 1영역에 복사하고 이 영역을 제외한 나머지 객체를 삭제한다.
    • Old Generation
      • 이곳의 인스턴스들은 추후 GC에 의해 사라진다.
      • 생명 주기가 긴 ‘오래된 객체’를 GC대상으로 하는 영역이다.

 

다음 글에서는, Java21의 Virtual Thread에 대해 알아보자.