Search Results for 'threshold'

1 POSTS

  1. 2013|05 HDFS - [운영] 파일 시스템 상태 확인(fsck)


# HDFS 파일 시스템 상태 확인


fsck 명령어 출력 결과 상태 정보

상태 내용
 Over-replicated blocks  복제본이 과도하게 생성된 경우를 의미.
  예) 3개의 복제본이 저장되어야 하는데, 3개를 초과해서 복제본이 저장된 경우.
 Under-replicated blocks  부족하게 복제된 블록 개수를 의미.
 예) 3개의 복제본이 저장되어야 하는데, 2개 혹은 1개의 복제본만 저장되어 있다면
  부족하게 저장된 복제본으로 인식.
  주로 네임노드가 다운되기 직전이나 직후에 데이터를 저장할 경우 발생.
 Missing replicas  Under-replicated blocks 과 함께 발생.
 Mis-replicated blocks  복제된 블록이 유실된 상태.
 Corrupt blocks  블록에 오류가 발생한 경우.
 Default replication factor  기본 설정 복제 개수(hdfs-site.xml 의 dfs.replication 에 설정된 개수)
 Number of data-nodes  데이터 노드의 수
 Number of racks  서버 랙의 수


fsck 명령어를 이용하여 파일 시스템의 상태를 확인
[hadoop@master bin]$ ./hadoop fsck /
FSCK started by hadoop from /192.168.1.17 for path / at Sun May 12 11:22:40 KST 2013
....
............Status: HEALTHY
 Total size:    12038398409 B
 Total dirs:    42
 Total files:   50 (Files currently being written: 4)
 Total blocks (validated):      216 (avg. block size 55733325 B)
 Minimally replicated blocks:   216 (100.0 %)
 Over-replicated blocks:        0 (0.0 %)
 Under-replicated blocks:       163 (75.46296 %)
 Mis-replicated blocks:         0 (0.0 %)
 Default replication factor:    2
 Average block replication:     1.2453704
 Corrupt blocks:                0
 Missing replicas:              163 (60.594795 %)
 Number of data-nodes:          2
 Number of racks:               1
FSCK ended at Sun May 12 11:22:41 KST 2013 in 16 milliseconds

// 시스템 상태가 정상
The filesystem under path '/' is HEALTHY

// 시스템 상태에 오류 발생
The filesystem under path '/' is CORRUPT


# CORRUPT 발생시 오류 블록 삭제


블록의 복제본이 부족하거나 과도하게 복제된 경우는 하둡이 자동으로 정리하기 때문에 큰 문제가 되지 않습니다.
하지만 블록이 유실되거나, 오류가 발생한 경우 해당 블록을 사용하는 파일을 더는 조회할 수 없는 심각한 상황을 초래합니다.
데이터 원본이 존재하거나 하둡 클러스터 자체를 이중화했다면 복구가 가능하지만 이렇게 대비하지 않을 경우 더는 파일을 사용할 수 없습니다.
이러한 블록은 더 이상 활용할 수가 없기 때문에 HDFS에서 삭제 해야 합니다.
fsck 명령어는 오류가 발생한 블록을 일괄적으로 삭제하는 기능을 제공합니다.
"-delete" 옵션은 해당 블록이 즉시 삭제.
"-move" 옵션은 루트 하단에 "/lost+found" 폴더로 해당 블록이 옮겨짐.

옵션 사용
[hadoop@master bin]$ ./hadoop fsck -delete
 or
[hadoop@master bin]$ ./hadoop fsck -move


# balancer -threshold [threshold]


- 복제본이 부족하거나 과도하게 생성된 경우 밸런서 명령으로 정리

해당 메세지
Target Replicas is 2 but found 1 replica(s)
2개의 복제본을 가져야 하지만 1개의 복제본만 확인됨

예제 파일 사이즈
-rw-rw-r--.  1 hadoop hadoop 124183 2008-08-22 12:55 1987.csv
-rw-rw-r--.  1 hadoop hadoop 489297 2008-08-22 13:03 1988.csv

해석
1987.csv = 121MB  은 121/64MB(기본블럭사이즈) = 2 (아래에서 1987.csv 2개의 블럭으로 나눠짐)
1987.csv = 477MB  은 477/64MB(기본블럭사이즈) = 7.4 (아래에서 1988.csv 8개의 블럭으로 나눠짐)

복제본 부족 메시지
[hadoop@master bin]$ ./hadoop fsck /
FSCK started by hadoop from /192.168.1.17 for path / at Sun May 12 11:49:20 KST 2013
.
/user/hadoop/data/1987.csv:  Under replicated blk_4089892973365100866_1613. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1987.csv:  Under replicated blk_-8012340995855654662_1613. Target Replicas is 2 but found 1 replica(s).
.
/user/hadoop/data/1988.csv:  Under replicated blk_9151390857073247536_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_5371074652069792230_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_6962433825992808953_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_-8510060616332179956_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_-892042068105233384_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_7886950007000431028_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_769487515851279492_1615. Target Replicas is 2 but found 1 replica(s).

/user/hadoop/data/1988.csv:  Under replicated blk_-7504786189269517436_1615. Target Replicas is 2 but found 1 replica(s).


블록 재분배 명령


밸런서로 블록 재분배

hadoop balancer -threshold [퍼센트:기본 10%]

[hadoop@master bin]$ ./hadoop balancer -threshold 10
13/05/12 12:22:31 INFO balancer.Balancer: Using a threshold of 10.0
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved
13/05/12 12:22:31 INFO net.NetworkTopology: Adding a new node: /default-rack/192.168.1.19:50010
13/05/12 12:22:31 INFO net.NetworkTopology: Adding a new node: /default-rack/192.168.1.45:50010
13/05/12 12:22:31 INFO balancer.Balancer: 0 over utilized nodes:
13/05/12 12:22:31 INFO balancer.Balancer: 0 under utilized nodes:
The cluster is balanced. Exiting...
Balancing took 404.0 milliseconds

셸 스크립트로 블록 재분배
[hadoop@master bin]$ ./hadoop-daemon.sh start balancer
starting balancer, logging to /home/hadoop/hadoop-1.1.2/logs/hadoop-hadoop-balancer-master.namenode.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved
The cluster is balanced. Exiting...
Balancing took 386.0 milliseconds


참고 : 시작하세요! 하둡 프로그래밍


※ 위 내용은, 여러 자료를 참고하거나 제가 주관적으로 정리한 것입니다.
   잘못된 정보나 보완이 필요한 부분을, 댓글 또는 메일로 보내주시면 많은 도움이 되겠습니다.
05 12, 2013 12:48 05 12, 2013 12:48


Trackback URL : http://develop.sunshiny.co.kr/trackback/890

Leave a comment


Recent Posts

  1. HDFS - Python Encoding 오류 처리
  2. HP - Vertica ROS Container 관련 오류...
  3. HDFS - Hive 실행시 System Time 오류
  4. HP - Vertica 사용자 쿼리 이력 테이블...
  5. Client에서 HDFS 환경의 데이터 처리시...

Recent Comments

  1. Generally I do not read post on bl... 레기읏룸 셔츠룸 차이. 레깅스룸 부엉이 01 24,
  2. Wonderful site. A lot of useful in... /427 01 23,
  3. 안녕하세요^^ 배그핵
  4. 안녕하세요^^ 도움이 되셨다니, 저... sunshiny
  5. 정말 큰 도움이 되었습니다.. 감사합... 사랑은

Recent Trackbacks

  1. cabo packages cabo packages %M
  2. airbnb host insurance airbnb host insurance %M
  3. beaches in cabo beaches in cabo %M
  4. joe’s dj service joe’s dj service %M
  5. short term rental property insurance short term rental property insurance %M

Calendar

«   01 2020   »
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  

Bookmarks

  1. 위키피디아
  2. MysqlKorea
  3. 오라클 클럽
  4. API - Java
  5. Apache Hadoop API
  6. Apache Software Foundation
  7. HDFS 생태계 솔루션
  8. DNSBL - Spam Database Lookup
  9. Ready System
  10. Solaris Freeware
  11. Linux-Site
  12. 윈디하나의 솔라나라

Site Stats

TOTAL 2824860 HIT
TODAY 479 HIT
YESTERDAY 443 HIT