잘못알고 있는 말들이나 지식들을 정리(?)

주석

부적절한 정보

  • 다른 시스템(소스 관리 시스템, 버그 추적 시스템, 이슈 추적 시스템 등)에 저장할 정보는 주석으로 적절하지 못하다.
  • 예를 들어
    • 변경 이력은 장황한 날짜와 따분한 내용으로 소스코드를 번잡하게 만든다.

쓸모 없는 주석

오래된 주석, 엉뚱한 주석, 잘못된 주석은 더 이상 필요가 없다.
주석은 빨리 낡는다. 금방 필요없어질 주석은 달지 않는 편이 좋다.

중복된 주석

코드만으로도 충분한데 구구절절 설명하는 주석
i++; // i 증가

성의없는 주석

필요한 주석은 잘 작성되어야 한다.
주석에도 시간을 들여 멋지게 작성해야 한다.
단어를 신중하게 선택한다. 당연한 소리를 반복하지 않고 간결하고 명료하게 작성한다.

주석처리된 코드

코드를 읽다가 주석처리된 코드가 나오면 불편하다.
중요한 코드인지, 필요없는 코드인지 알 길이 없다.
하지만 아무도 삭제할 수 없다. 누군가에게는 필요한 코드일수도 있으니
따라서 해당 코드는 매일매일 낡아간다.
시간이 지나면서 주석처리된 코드 내에 사용된 변수/함수 등의 이름은 바뀌지만 주석코드를 수정하지는 않는다.
주석처리된 코드는 지워라. 필요한 사람이 이전버전을 확인할테니

환경

여러 단계로 빌드해야 한다

빌드는 간단히 한 단계로 끝나야 한다.

여러 단계로 테스트해야 한다

모든 단위 테스트는 한 명령으로 돌려야한다.
IDE에서 버튼 하나로 모든 테스트를 돌린다면 가장 이상적이다.

함수

너무 많은 인수

함수에서 파라미터의 개수는 적을수록 좋다.

출력 인수

Swift에서는 Stored Property를 사용하는 것이 좋을 듯

플래그 인수

Boolean 인수는 함수가 여러 기능을 수행한다는 명백한 증거이다.

죽은 함수

아무도 호출하지 않는 함수는 삭제한다.
주석처리된 코드랑 같은 느낌

일반

한 소스 파일에 여러 언어를 사용한다

오늘날 프로그래밍 환경은 한 소스 파일에서 다양한 언어를 지원한다.
자바 소스 파일 내에 HTML, JS 등을 포함한다.
이상적으로는 소스 파일 하나에 언어 하나만 사용하는 방식이 좋다.

당연한 동작을 구현하지 않는다

함수나 클래스는 '이름'과 연관된 혹은 당연하게 여길만한 동작을 해야 한다.

경계를 올바로 처리하지 않는다

코드는 올바로 동작해야 한다.
하지만 우리는 올바른 동작이 아주 복잡하다라는 말을 간과한다.
부지런함을 대신할 지름길은 없다.
모든 경계 조건, 구석진 곳, 예외는 우아하고 직관적인 알고리즘을 좌초시킬 암초다.
모든 조건들을 커버할 수 있는(커버리지 넓은) TC를 작성해서 테스트하라.

안전 절차 무시

예전 '체르노빌 원전 사고'는 책임자가 안전 절차를 무시하는 바람에 일어났다.
귀찮고 번거롭다는 이유로...

중복

이 책에서 나오는 가장 중요한 규칙 중 하나
DRY 법칙

  • Don't Repeat Yourself
    책에서 이 규칙은 "모든 테스트를 통과한다"는 규칙 다음으로 중요하다고 꼽았다.

코드에서 중복을 발견할 때마다 추상화할 기회로 간주하다.
중복된 코드를 하위 클래스로 분할하라.
이렇듯 추상화로 중복을 처리하면 설계 언어의 어휘가 늘어난다.

  1. 가장 뻔한 유형으로는 똑같은 코드가 여러 차례 나오는 중복이다.
    Ctrl + C/V 처럼 보이는 코드이다.
  2. 여러 모듈에서 일련의 switch/case, if/else 문으로 똑같은 조건을 거듭 확인하는 중복이다.
    이런 중복은 다형성으로 대체해야 한다.
  3. 알고리즘이 유사하나 코드가 서로 다른 중복이다.
    중복은 중복이므로 템플릿 메소드 패턴이나 전략 패턴으로 제거한다.

최근에 나온 디자인 패턴의 대다수는 중복을 제거하기 위한 방법이다

추상화 수준이 올바르지 못하다

추상화는 저차원 상세 개념에서 고차원 일반 개념을 분리한다.
추상화로 개념을 분리할 때는 철저해야 한다.
예를 들어, 세부 구현과 관련한 상수, 변수, 유틸리티 함수는 기초 클래스에 넣으면 안된다.
기초 클래스는 구현 정보에 무지(알고 있지 않는 것이)해야 마땅하다.

EX
public interface Stack{
Object pop() throws EmptyException;
void push(Object o) throws FullException;
double percentFull();
class EmptyException extends Exception{}
class FullException extends Exception{}
}

percentFull() 은 추상화 수준이 올바르지 못하다
Stack을 구현하는 방법은 다양하다.

기초 클래스가 파생 클래스에 의존한다.

개념을 기초 클래스와 파생 클래스로 나누는 이유는 독립성을 보장하기 위해서다.
일반적으로 기초 클래스는 파생 클래스를 몰라야 마땅하다.

과도한 정보

잘 정의된 모듈은 인터페이스가 아주 작다. 하지만 작은 인터페이스로도 많은 동작이 가능하다.
잘 정의된 인터페이스는 많은 함수를 제공하지 않는다. -> 결합도가 낮다.
부실하게 정의된 인터페이스는 많은 함수를 제공한다. -> 결합도가 높다.

클래스는 제공하는 메서드가 작을수록 좋다.
함수는 알고 있는 변수 수도 작을수록 좋다.

자료, 유틸리티 함수, 상수, 임시 변수를 숨겨라

죽은 코드

죽은 코드란 실행되지 않는 코드이다.
불가능한 조건을 확인하는 if / throw 문이 없는 try 문에서 catch 블록
해당 코드는 제거하라

수직 분리

변수와 함수는 사용되는 위치에 가깝게 정의한다.
지역 변수는 처음으로 사용하기 직전에 선언하며 수직으로 가까운 곳에 위치해야 한다.
선언한 위치로부터 몇백줄 아래에서 사용되면 안된다.

일관성 부족

어떤 개념을 특정 방식으로 구현했다면 유사한 개념도 같은 방식으로 구현하라.
착실하게 적용한다면 간단한 일괄성만으로도 코드를 읽고 수정하기 쉬워진다.

잡동사니

비어 있는 기본 생성자가 왜 필요한가?
아무도 사용하지 않는 변수, 호출되지 않는 함수, 정보를 제공하지 않는 주석 등
제거하라

인위적 결합

서로 무관한 개념을 인위적으로 결합하지 않는다.
일반적으로 enum은 특정 클래스에 속할 이유가 없다.
enum이 클래스에 속한다면 enum을 사용하는 코드가 특정 클래스를 알아야만 한다.
범용 static 함수도 마찬가지이다.
편한 곳에 두지 않고, 필요한 곳에 시간을 들여 놓아라

기능 욕심

'마틴 파울러'가 말하는 코드 냄새 중 하나이다.
클래스 메서드는 자기 클래스의 변수와 함수에 관심을 가져야지 다른 클래스의 변수와 함수에 관심을 가져서는 안된다.
메서드가 다른 객체의 참조자와 변경자를 사용해 그 객체 내용을 조작한다면 메서드가 그 객체 클래스의 범위를 욕심내는 것이다.

EX
public class HourlyPayCalculator{
public Money calculateWeeklyPay(HourlyEmployee e){
int tenthRate = e.getTenthRate().getPennies();
int tenthsWorked = e.getTenthsWorked();

    ...

    return new Money(straightPay + overtimePay);
}

}

calculateWeeklyPay 메서드는 HourlyEmployee 객체에서 온갖 정보를 가져 온다.
즉, calculateWeeklyPay 메서드는 자신의 클래스인 HourlyPayCalculator 범위를 넘어 선다.

EX
public class HourlyPayCalculator{
private HourlyEmployee employee;

//생성자(){
    this.employee = e;
}

String reportHoues(){
    return String.format("Name : %s.....", employee.getName(), employee.getTenthWorked()/10...)
}

}

해당 reportHours() 역시 HourlyEmployee 클래스를 욕심낸다. 하지만 HourlyEmployee 클래스가 리포트 형식을 알 필요는 없다.
함수를 HourlyEmployee 클래스로 옮기면 OOP의 여러 원칙을 위반한다.
따라서 이와 같은 예외 케이스에는 다른 클래스를 욕심내는 상황이 있을 수 있다.

선택자 인수

함수 호출 끝에 달리는 false 인수만큼이나 밉살 스런 코드도 없다.
예) 초과 근무 수당은 1.5배로 계산해야 하는 메소드 내에서
public int calculateWeeklyPay(boolean overtime){
...
double overtimeRate = overtime ? 1.5 : 1.0 * tenthRate;
...
}
-> straightPay(), overTImePay(), overTimeBonus() ... 로 쪼개는 것이 낫다.
enum, int, boolean 등의 인수로 함수의 동작을 제어하는 것은 바람직하지 않다.

모호한 의도

코드를 짤 때는 의도를 분명히 밝힌다.

잘못 지운 책임

개발자가 내리는 가장 중요한 결정 중 하나가 코드를 배치하는 위치다.
예) PI 상수는 어디에 들어갈까? -> 삼각함수를 선언한 클래스에 넣어야 한다.

부적절한 static 함수

Math.max(a, b)는 좋은 static 메서드다.
특정 인스턴스와 관련된 기능이 아니다.
new Math().max(a, b)나 a.max(b) 같은 형태가 오히려 더 우습다.

EX
HourlyPayCalculator.calculatePay(employee, overtimeRate);

언뜻 보면 static 함수로 여겨도 적당하다. 특정 객체와 관련이 없으면서 모든 정보를 인수에서 가져오니까
하지만 함수를 재정의할 가능성이 존재한다.
수당을 계산하는 알고리즘이 여러 개일지도 모른다.

OverTimeHourlyPayCalculator 와 StraightTimeHourlyPayCalculator 로 분리하고 싶을지도 모른다.
따라서 해당 메서드는 static이 아닌 인스턴스 메서드가 적절하다.

서술적 변수

프로그램 가독성을 높이는 가장 효과적인 방법 중 하나가 계산을 여러 단계로 나누고 중간 값으로 서술적인 변수 이름을 사용하는 방법이다.

이름과 기능이 일치하는 함수

Date newDate = date.add(5);
해당 코드는 5일, 5시간, 5주 등 어떻게 변경하는 함수인지 알 수가 없다.
또한, 있던 date객체를 변경하는 것인지 새로운 Date객체를 반환하는 것인지 알 수가 없다.

5일을 더하여 변경하는 함수라면 addDaysTo()
5일을 더하여 새 Date 객체를 반환하는 함수라면 daysLater() 가 적당하다.

알고리즘을 이해하라

대다수 괴상한 코드는 사람들이 알고리즘을 충분히 이해하지 않은 채 코드를 구현한 탓이다.
잠시 멈추고 실제 알고리즘을 고민하는 대신, 여기저기 if문과 print를 사용하여 코드를 돌리는 탓이다.
알고리즘을 다 안다고 하지만 실제는 코드가 '돌아갈' 때까지 이리저리 찔러본다.

논리적 의존성을 물리적으로 드러내라

한 모듈이 다른 모듈에 의존한다면 물리적인 의존성도 있어야 한다. 논리적 의존성만으로는 부족하다.

If/Else, Switch/Case 보다는 다형성을 사용하라

3장에서 새 유형을 추가할 확률보다 새 함수를 추가할 확률이 높은 코드에서는 switch가 적합하다 주장했다.

  1. 대다수 개발자가 switch 문을 사용하는 이유는 그 상황에서 가장 올바른 선택이기보다는 쉬운 선택이기 때문
  2. 유형보다 함수가 더 쉽게 변하는 경우는 극히 드물다.

표준 표기법을 따르라

팀은 구현 표준을 따라야 한다.
인스턴스 변수 이름을 선언하는 위치, 클래스/메서드/변수 이름 명명 방법 등을 명시해야 한다.

매직 숫자는 명명된 상수로 교체하라

SECONDS_PER_DAY 는 86,400이다.
하지만 TWO, WORK_HOURS_PER_DAY 같은 상수가 필요할 까?
확실히 TWO는 필요가 없다. 현재 법정 근무 시간이 8시간 이지만 바뀔수도 있으니 WORK_HOURS_PER_DAY는 필요할수도 있다.

정확하라

관례보다 구조를 사용하라

설계 결정을 강제할 때는 규칙보다 관례를 사용한다.
예를 들어, enum 변수가 멋진 ㄴwitch/case 문보다 추상 메서드가 있는 기초 클래스가 더 좋다.

조건을 캡슐화하라

부울 논리는 이해하기 어렵다.
조건의 의도를 분명히 밝히는 함수로 표현하라
if(shouldVeDeleted(timer)) 라는 코드는 아래의 코드보다 좋다
if(timer.hasEcpired() && !timer.isRecurrent())

부정 조건을 피하라

부정 조건은 긍정 조겅보다 이해하기 어렵다.
if(buffer.shouldCompact()) 가 아래 코드보다 좋다.
if(!buffer.shouldNotCompact())

함수는 한 가지만 해야 한다.

함수를 짜다보면 한 함수 안에 여러 단락을 이어, 일련의 작업을 수행하고픈 유혹에 빠진다.

EX
public void pay(){
for (Employee e : employees){
if(e.isPayday()){
Money pay = e.calculatePay();
e.deliverPay(pay);
}
}
}

위의 함수는 3가지 임루를 수행한다.

  1. 직원 목록을 루프로 돌며
  2. 각 직원의 월급일을 확인
  3. 해당 직원에게 월급을 지급

public void pay(){
for(Employee e: employees){
payIfNecessary(e);
}
}

private void payIfNecessary(Employee e){
if (e.isPayday()){
calculateAndDeliverPay(e);
}
}

private void calculateAndDeliverPay(Employee e){
Money pay = e.calculatePay();
e.deliverPay(pay);
}

숨겨진 시각적인 결합

때로는 시간적인 결합이 필요하다. 시간적인 결합을 숨기면 안된다.
public void dive(String reason){
saturateGradient();
reticulateSplines();
diveForMoog(reason);
}

보다는

public void dive(String reason){
Gradient gradient = saturateGradient();
List< Spline > splines = reticulateSplines(gradient);
diveForMoog(splines, reason);
}
가 더 좋다.
함수가 복잡해지기 하지만 시간적인 결합을 명백히 드러내어 수정을 방지하는 역할을 한다.

일관성을 유지하라

코드 구조를 잡을 때는 이유를 고민하라.
그 이유를 코드 구조로 명백히 표현하라.
구조에 일관성이 없어 보인다면, 다른 사람들이 맘대로 바꿔도 된다고 생각한다.

경계 조건을 캡슐화하라

경계 조건은 빼먹거나 놓치기 십상이다. 경계 조건은 한 곳에서 별도로 처리한다.
코드 여기저기에서 처리하지 않는다.
if(level + 1 < tags.length){
parts = new Parse(level + 1);
}
보다는
int nextLevel = level + 1;
을 사용해야 한다.

함수는 추상화 수준을 한 단계만 내려가야 한다

함수 내 모든 문장을 추상화 수준이 동일해야 한다.
그 추상화 수준은 함수 이름이 의미하는 작업보다 한 단계만 낮아야 한다.

설정 정보는 최상위 단계에 둬라

추상화 최상위 단계에 둬야 할 기본값 상수나 설정 관련 상수를 저차원 함수에 숨겨서는 안된다.
대신 고차원 함수에서 저차원 함수를 호출할 때, 인수로 넘긴다.

추이적 탐색을 피하라

일반적으로 한 모듈은 주변 모듈을 모를수록 좋다.
A가 B를 사용하고 B가 C를 사용한다 하더라도 A가 C를 알 필요는 없다.
이를 디미터의 법칙이라 부른다.
내가 아는 모듈이 연이어 자신이 아는 모듈을 따라가며 시스템 전체를 휘저을 필요가 없다는 의미이다.
여러 모듈에서 a.getB().getC() 라는 형태를 사용한다면 설계와 아키텍처를 바꿔 B와 C사이에 Q를 넣기가 어렵다.

점진적인 개선

출발을 좋았으나 확장성이 부족했던 모듈을 소개하고 개선하는 단계로 살펴본다.

.....

이름을 붙인 방법, 함수 크기, 코드 형식

프로그램을 처음부터 잘 짜기란 쉽지 않다.
또한 대부분이 그럴 수 없다.
프로그래밍은 과학보다는 공예에 가깝다. 깨끗한 코드를 짜려면 먼저 지저분한 코드를 짠 뒤에 정리해야 한다.

글을 쓸 때도 초안 -> 수정 -> 수정 -> 최종안 을 거쳐가 듯, 코드도 단계적으로 개선해야 한다.
대다수의 신참 프로그래머는 해당 단계를 무시하거나 충실히 따르지 않는다.
그들은 돌아가는 프로그램을 목표로 잡는다. 일단 돌아가면 방치한다.

1차 초안

이 표현은 낯 뜨거운 표현이다.
결국 미완성이다.
누구든 첫 버전부터 엉망이진 않다. 버전을 거치며 구현하는 기능이 많아지고 코드가 길어지는 등의 단계를 거듭할수록
코드는 점점 내 손을 벗어난다. (그래서 작게작게 만드는 거??)

최종 목표가 모든 자료형 타입의 인자를 받는 다고 가정하자.

버전 1. boolean 타입만 구현
코드가 그리 엉망은 아니다
버전 2. String 타입도 구현
코드가 점점 길어지며, setBoolean, setString 등의 같은 기능을 하는 중복 메소드가 생긴다.
-> 책에서는 class 상속을 이용하여 중복 메소드를 하나로 줄였다.
버전 3. Int, Double 등 구현
class 상속을 이용하지 않고 별도로 구현시, 사용하는 프로퍼티/메소드 등 쓸데없는 중복이 많을 것이다.

그래서 멈췄다.

버전 2를 마친 후, 코드를 더 작성해서는 안된다.
-> 아직 추가할 타입이 2개나 남았는데, 벌써 코드가 이렇다고? 그 2개를 더 작성하면 어떻게 될지 눈에 훤하다. 그런데도 계속 작성할 것인가?
-> 물론 밀어붙이면 어떻게든 돌아가는 프로그램을 완성했겠지만
-> 그 이후가 문제다. 어떻게 유지보수할 것인가?

코드 구조를 좋은 상태로 만들기 위한 일시정지

  • 기능을 더 이상 추가하지 않고 리팩터링 시작
  • String, Integer 인수 타입을 추가한 경험을 통해, 새로운 인수 타입을 추가하려면 주요 지점 세 곳에다 코드를 추가해야 한다는 것을 겪었다.
    1. HashMap을 선택하기 위해 스키마 요소의 구문을 분석
    2. 인수 유형을 분석해 진짜 유형으로 변환
    3. getXXX 메서드를 구현해 호출자에게 진짜 유형을 반환
  • 인수 유형을 다양하지만 모두가 유사한 메서드를 제공하므로 클래스 하나가 적합하다고 판단하여 ArgumentMarshaler Abstract Class를 작성

점진적으로 개선하다

프로그램을 망치는 가장 좋은 방법 중 하나는 개선이라는 이름 하에 구조를 뒤집는 행위다
-> 프로그램을 '개선' 전과 같이 돌리기가 어렵다.
-> TDD를 통해 작성되어 있던 TC를 이용할 수 있다.

책에서는 Args Class를 구현하기 이전에 이미 단위테스트와 인수테스트를 만들었다.
그리고 해당 테스트를 모두 통과하면 올바로 동작한다고 봐도 무방했다.

순차적인 개선

기존에 변경되어야 하는 곳(parse, get, set) 메소드를 단번에 수정하지 않는다.

  1. ArgumentMarshaler Abstract Class가 아닌 ArgumentMarshaler Class의 골격을 추가하여 코드를 최소로 건드리는 변경만 가한다.
    • 해당 변경으로 꺠지는 코드를 수정
  2. 수정 후에 테스트케이스를 모두 통과하는지 확인해야 한다.
    • 단번에 많은 코드를 수정하고 테스트를 돌리면 어디가 잘못되었는지 알 수 없다.
  3. 구현할 인수 타입들을 모두 구현한 뒤, ArgumentMarshaler 를 추상 클래스로 선언하고 타입마다 XXXArgumentMarshaler Class를 선언
    • get/set 메소드를 추상 메소드로 선언
  4. Integer/String 에는 Iterator가 필요하지만 Boolean에는 필요가 없었지만, ArgumentMarshaler에서 모두 처리하기 위해, Iterator를 매개변수로 갖는 추상 메소드를 선언
  5. Args Class에서 던지는 예외는 Args와 관련이 있는 것
    • Integer관련 Exception은 IntegerArgumentMarshaler Class에서, String은 StringArgumentMarshaler에서 던진 후, Args와 같은 호출한 곳에서 Args와 관련있는 Exception으로 치환 혹은 생성하여 throw

버전 1에서부터 점진적으로 리팩토링을 진행하면서

  • 주로 Args Class에서 코드를 삭제했다.
    • 삭제된 코드는 ArgsException Class, ArgumentMarshaler Class로 옮겨졌다.

결론

그저 돌아가는 코드만으로는 부족하다. 돌아가는 코드가 심하게 망가지는 사례가 흔하기 때문이다.
설계와 구조를 개선할 시간이 없다고 변명할 지 모르지만 동의할 수 없다.
나쁜 코드보다 프로젝트에 악영향을 미치는 것은 없다

  • 나쁜 요구사항
    • 다시 정의하면 된다
  • 나쁜 팀 역학
    • 복구하면 된다
  • 나쁜 코드
    • 썩어 문드러진다.
    • 팀의 발목을 잡는다.

처음부터 코드를 깨끗하게 유지하기란 상대적으로 쉽다. 아침에 엉망으로 만든 코드를 오후에 정리하기는 어렵지 않다.
그러므로 코드는 언제나 최대한 깔끔하고 단순하게 정리하자.

동시성

객체는 처리의 추상화다. 스레드는 일정의 추상화다.
- 제임스 O. 코플리엔

동시성과 깔끔한 코드는 양립하기 어렵다.

동시성이 필요한 이유

동시성은 결합을 없애는 전략이다.
무엇언제를 분리하는 전략이다.
스레드가 하나인 프로그램은 무엇과 언제가 밀접하다.

하나의 예로 한번에 한 사용자를 처리하는 시스템이 있다고 가정하자.
사용자를 처리하는 시간은 1초다.
사용자가 늘어날수록 시스템의 응답속도도 늦춰진다.
1000명 뒤에 줄 서고 싶은 사용자는 없다.

미신과 오해

이렇듯 동시성이 필요한 상황이 존재한다. 하지만 동시성은 어렵다. 정말 어렵다.

일반적인 미신과 오해
  • 동시성은 항상 성능을 높인다.
    -> 대기 시간이 아주 길어 여러 스레드가 프로세서를 공유할 수 있거나, 여러 프로세서가 동시에 처리한 독립적인 계산이 충분히 많은 경우에만 성능이 향상된다.

  • 동시성을 구현해도 설계는 변하지 않는다.
    -> 단일 스레드 vs 다중 스레드 시스템은 설계가 다르다.

  • 웹 또는 EJB 컨테이너를 사용하면 동시성을 이해할 필요가 없다.
    -> 실제로는 컨테이너가 어떻게 동작하고, 어떻게 동시 수정, 데드락 등과 같은 문제를 피할 수 있는지를 알아야 한다.

타당한 생각
  • 동시성은 다소 부하를 유발한다.
    -> 실제로 성능에서도 약간의 부하가 걸리며, 코드도 더 길어진다.

  • 동시성은 복잡하다

  • 동시성 버그는 재현하기 어렵다.

난관

동시성이 구현하기 어려운 이유는 무엇일까?

public class X{
    private int lastIdUsed;

    public int getNextId(){
        return ++lastIdUsed;
    }
}

X를 생성하고 lastIdUsed를 42로 설정한 후, 두 스레드가 해당 인스턴스를 공유한다.
두 쓰레드가 getNextId();를 호출한다고 가정하자

결과

1) 한 스레드는 43, 다른 스레드는 44
2) 한 스레드는 44, 다른 스레드는 43
3) 한 스레드는 43, 다른 스레드는 43

정확하게 이해하기 위해서는 JIT 컴파일러가 바이트 코드를 처리하는 방식, 자바 메모리 무델이 Atomic으로 간주하는 최소 단위를 알아야 한다.

동시성 방어 원칙

동시성 코드가 일으키는 문제로부터 시스템을 방어하는 원칙과 기술을 소개한다.

SRP

SRP는 주어진 메서드/클래스/컴포넌트를 변경할 이유가 하나여야 한다는 원칙이다.
동시성은 복잡성 하나만으로도 따로 분리할 이유가 충분하다.
즉, 동시성 관련 코드는 다른 코드와 분리해야 한다는 뜻이다.

고려사항

  • 동시성 코드는 독자적인 개발, 변경, 조율 주기가 있다.
  • 동시성 코드에는 독자적인 난관이 있다.
  • 잘못 구현한 동시성 코드는 별의별 방식으로 실패한다.

권장사항

  • 동시성 코드는 다른 코드와 분리하라
자료 범위를 제한하라

앞서 봤듯이, 객체 하나를 공유한 후 동일 필드를 수정하던 두 스레드가 서로 간섭하므로 예상치 못한 결과를 내놓을 수 있다.
이런 문제를 해결하기 위해 임계 영역(C.S)을 synchronized 키워드로 보호하라 권장한다.
이러한 CS 수를 줄이는 기술이 중요하다
공유 자료를 수정하는 위치가 많을 수록 다음 가능성도 커진다.

  • 보호할 임계영역을 빼먹는다.
  • 모든 임계영역을 올바로 보호했는지 확인하느라 시간이 더 든다.
  • 그렇지 않아도 찾아내기 어려운 버그가 더 찾기 어려워진다.

권장사항

  • 자료를 캡슐화하라. 공유 자료를 최대한 줄여라.

자료 사본을 사용하라

공유 자료를 줄이려면 처음부터 공유하지 않는 방법이 좋다.
어떤 경우에는 객체를 복사해 읽기 전용으로 사용하는 방법이 가능하다.
어떤 경우에는 각 스레드가 객체를 복사해 사용한 후, 한 스레드가 해당 사본에서 결과를 가져오는 방법도 가능하다.

물론 객체를 복사하는 데 걸리는 시간, 부하가 부담스러울 수 있다.
하지만 사본을 사용해서 얻는 이점이 더 클 것이다.

스레드는 가능한 독립적으로 구현하라

자신만의 세상에 존재하는 스레드를 구현한다.
즉, 다른 스레드와 자료를 공유하지 않는다. 각 스레드는 클라이언트 요청 하나를 처리한다.
모든 정보는 로컬 변수에 저장한다.
그렇게 되면 스레드는 자신만 있는 것처럼 돌아갈 수 있다 -> 다른 스레드와 동기화가 필요없으므로

예) HTTPServlet 클래스에서 파생된 클래스는 모든 정보를 doGet과 doPost 매개변수를 받는다.
각 서블릿은 마치 자신이 독자적인 시스템에서 동작하는 것처럼 요청을 처리한다.
각자의 로컬 변수만 사용한다면 동기화 문제를 일으킬 가능성을 전무하다.

권장사항

  • 독자적인 스레드로, 가능하면 다른 프로세서에서, 돌려도 괜찮도록 자료를 독립적으로 분리하라

라이브러리를 이해하라

자바 5는 동시성 측면에서 이전보다 나아졌다. (그 이후의 나온 자바 버전들도 계속해서 나아졌겠지...)

예) Thread-Safe Collection 사용
ConcurrentHashMap은 거의 모든 상황에서 HashMap보다 빠르다. 또한 다중 스레드 환경에서의 문제도 발생하지 않는다.

권장사항

  • 언어가 제공하는 프레임워크와 클래스를 검토하라

실행모델을 이해하라

다중 스레드 App을 분류하는 방식은 여러가지다

용어

  1. 한정된 자원(Bound Resource)
    다중 스레드 환경에서 사용하는 자원으로 크기나 숫자가 제한적
    DB Connection, 길이가 일정한 버퍼 등

  2. 상호 배제(Mutual Exclusion)
    한번에 한 스레드만 공유 자료나 자원을 사용할 수 있는 경우

  3. 기아(Starvation)
    한 스레드나 여러 스레드가 오랫동안 자원을 기다리는 상황

  4. 데드락(Deadlock)
    여러 스레드가 서로 필요한 자원을 갖고 상대가 끝나기를 기다린다.

  5. 라이브락(Livelock)
    락을 거는 단계에서 각 스레드가 서로를 방해한다.

예시

  1. 생산자-소비자
    하나 이상의 생산자가 버퍼/큐에 정보를 생성하여 넣는다.
    하나 이상의 소비자가 대기열에서 정보를 가져와 사용한다.
    대기열은 한정된 자원이다.

생산자는 대기열에 빈공간이 있어야 새 정보를 넣는다.
소비자는 대기열에 정보가 있어야 가져와 사용한다.

생산자는 정보를 넣고 소비자에게 알린다.
소비자는 정보를 빼고 생산자에게 알린다.

If) 동시성 문제를 해결하지 않으면, 생산자와 소비자 서로 기다리는 상황 발생 가능

  1. 읽기-쓰기
    읽기 쓰레드를 위한 주된 정보원으로 공유 자원을 사용하지만, 쓰기 쓰레드가 공유 자원을 가끔 갱신한다고 하자
    이런 경우에는 처리율(throughput)이 핵심이다.
    처리율이 너무 높거나 낮으면 기아 현상이 생기거나 오래된 정보가 쌓인다.

따라서 읽기/쓰기 스레드를 만족시킬 적당한 처리율이 필요하다.

전략

  • 읽기 스레드가 없을 때까지 갱신을 원하는 쓰기 스레드가 버퍼(차례)를 기다린다.
    BUT, 읽기 스레드가 계속 이어진다면 쓰기 스레드는 기아 상태에 빠진다.
  • 쓰기 스레드가 없을 때까지 읽기를 원하는 읽기 스레드가 버퍼(차례)를 기다린다.
    반대 상황
  1. 식사하는 철학자들
    양손에 포크를 쥐었을 때만, 식사가 가능하다.

권장사항

  • 위의 기본 알고리즘과 각 해법을 이해하라.

동기화

동기화하는 메서드 사이에 의존성이 존재하면 동시성 코드에 찾아내기 어려운 버그가 생긴다.
자바 언어는 synchronized 개념을 지원한다.
BUT, 공유 클래스 하나에 동기화된 메서드가 여럿이라면 다시 한번 확인해봐야 한다.

동기화하는 부분을 작게 만들어라

올바른 종료 코드는 구현하기 어렵다

스레드 코드 테스트하기

  • 그때그때의 설정, 시스템 설정, 부하에 따라 결과가 다르면 안된다. 어떤 상황에서라도 테스트를 통과할 때까지 추적하라.

결론

다중 스레드 코드는 올바로 구현하기 어렵다.
간단한 코드도 여러 스레드와 공유 자료를 추가하면서 어려워진다.
잠글 코드만 잠그고 이외의 코드는 잠그지 말아라.

어떻게든 문제는 생긴다. 해당 문제들을 잡아내기 위해 TDD를 따르고
가능한 많은 상황에서 테스트를 진행해 통과시켜라.

창발성

창발적 설계로 깔끔한 코드를 구현하자

착실하게 따르기만 하면 우수한 설계가 나오는 4가지 규칙이 있다면 따르겠는가?
SRP나 DIP와 같은 원칙을 적용하기 쉬워진다면 따르겠는가?

4가지(중요도 순)

  1. 모든 테스트를 실행한다.
  2. 중복을 없앤다.
  3. 프로그래머 의도를 표현한다.
  4. 클래스와 메서드 수를 최소로 줄인다.

모든 테스트를 실행하라

무엇보다 설계는 의도한 대로 돌아가는 시스템을 내놓아야 한다.
문서로는 시스템을 완벽히 설계했지만, 의도대로 돌아가는지 검증할 수 없다면 가치를 인정받기는 힘들다.

테스트를 철저히 거쳐 모든 테스트 케이스를 항상 통과하는 시스템은 '테스트가 가능한 시스템' 이다.

SRP를 준수하는 클래스는 테스트가 훨씬 더 쉽다.
TC가 많은수록 개발자는 테스트가 쉽게 코드를 작성한다.

결합도가 높으면 TC를 작성하기 어렵다.

-> 'TC를 만들고 계속 돌려라'라는 규칙을 따르면 시스템은 낮은 결합도, 높은 응집도의 결과를 얻을 수 있다.


리팩터링

TC를 모두 작성했다면 코드와 클래스를 정리해도 괜찮다.
코드를 정리하며 TC를 돌려 시스템의 기존 기능을 망가뜨리지 않았는지 확인한다.

중복을 없애라

중복은 추가작업, 추가위험, 불필요한 복잡도를 뜻한다.

똑같은 코드

-> 비슷한 코드는 더 비슷하게 고쳐주면 리팩터링이 쉽다.

ex) 미국과 유럽연합 각각에 근무하는 직원들의 휴가 일수를 계산하는 코드 작성

  1. 지금까지 근무한 시간을 바탕으로 휴가 일수 계산
  2. 휴가 일수가 직원이 속한 지역의 법정 일수를 만족하는지 확인
  3. 휴가 일수를 적용

이때, 미국과 유럽연합 각각의 직원들은 2번이 달라야 한다.
미국 - 미국 최소 법정 일수
유럽연합 - 유럽연합 최소 법정 일수

템플릿 메소드 패턴

이처럼 하위 클래스는 중복되지 않는 정보만 제공한다.

표현하라

대다수는 엉망인 코드를 접하거나 만든 경험이 있을 것이다.
자신이 이해하는 코드를 만들기는 쉽다.
코드를 짜면서 구석구석을 이해하며 짜니깐
BUT, 다른 사람이 해당 코드를 이해하기는 어렵다.

  1. 좋은 이름을 선택하라
  2. 함수와 클래스 크기를 가능한 줄인다.
  3. 표준 명칭을 사용한다.
    커맨드/방문자 패턴을 사용한다면 클래스 이름에 COMMAND/VISITOR를 넣어준다.
  4. 단위 테스트 케이스를 꼼꼼히 작성한다.
  5. 노력하라
    코드만 돌린 후에 다음 문제로 직행하는 사례가 너무 흔하다.
    나중 사람을 위해 조금이라도 노력하자.

클래스와 메서드 수를 최소로 줄여라

SRP를 준수하기 위해 극단으로 치달으면, 클래스와 메서드 수가 너무 많아진다.
따라서 가능한 작게 유지하면서 시스템 크기도 작게 유지하라.

결론

경험을 대신할 개발 기법은 없다.

+ Recent posts