- Issue
- 현상
- 설정에 memory channel, kafka source 와 sink를 사용 시 source topic에서 consuming한 데이터를 다시 source topic으로 producing하는 문제점 존재
- 원인
- kafka source 사용 시 flume event의 header에 topic 정보가 보함됨
- 예, Event: { headers:{topic=source.topic, timestamp=1491273904475}
- Event header에 있는 topic의 정보가 kafka sink에서 지정한 topic의 정보를 over ridden함
- 문서 내용
- Note Kafka Sink uses the topic and key properties from the FlumeEvent headers to send events to Kafka. If topic exists in the headers, the event will be sent to that specific topic, overriding the topic configured for the Sink.
- 로그 내용
- Using the static topic: sink.topic this may be over-ridden by event headers
- 문서 내용
- 따라서, kafka sink에서 지정한 topic 즉 sink.topic이 아닌 event header에 있는 topic 정보인 source.topic으로 데이터를 producing함
- kafka source 사용 시 flume event의 header에 topic 정보가 보함됨
- 해결
- Event header에 있는 topic 정보를 sink에서 지정한 topic 값과 같게 수정
- Event header에 있는 topic 정보를 제거
- Kafka channel 사용
- 하지만 원본 message 앞에 불 필요한 데이터가 추가됨
- ignoreTopicInHeader 설정
- 기타
- 기타
- 현상
- Sample
Thursday, June 15, 2017
Kafka 2 Kafka Using Flume
Subscribe to:
Post Comments (Atom)
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.