• ResNeSt Split-Attention Networks

    posted by kozistr tl;dr Amazon 에서 지난달에 재밌는 논문이 나왔는데요, 새로운 image classification architecture 를 제안했는데, EfficientNet 보다 더 좋은 성능을 보이는 human-made architecture 를 선보였습니다. 멋지죠? 핵심은 Split-Attention 을 사용하는것 인데요, 자세한 건 본문에 결론은 ImageNet 에서 새로운 SOTA 를 찍었습니다. paper : arXiv code : github Related Work...


  • Cotatron Transcription-Guided Speech Encoder for Any-to-Many Voice Conversion without Parallel Data

    posted by kozistr tl;dr 최근 mindslabd에서 VC (Voice Conversion)관련 논문이 나와서 오랜만에 요 쪽 domain 도 볼 겸 해서 논문을 읽게 됐습니다. 간단하게 요약하면, 유명한 google 의 TTS model 인 tacotron2 기반으로 given transcription 와 mel alignment 를 활용해서 speaker-independent linguistic representation 을 뽑는 concept(?) 입니다. 결론은 VCTK dataset 에서...


  • YOLOv4 Optimal Speed and Accuracy of Object Detection

    posted by kozistr tl;dr 이번에 리뷰할 논문은 오랜만에 나온 YOLO 4번째 버전인 YOLOv4 논문입니다. 이번 버전은 이야기가 있는(?) 버전인데, YOLO 원 저자인 Joe Redmon 님 께서 올해 2월쯤에 twit으로 CV 연구를 그만하겠다고 선언하셨는데 (정말 YOLO 하러 가셨을까), 과연 이번 버전엔 저자에 포함될지, darknet page에는 YOLOv4 가 올라갈지 이야기가 있었는데, 이번...


  • ELECTRA Pre-training Text Encoders as Discriminators Rather Than Generators

    posted by kozistr tl;dr 이번에 리뷰할 논문은 ELECTRA 란 google ai 에서 3월에 발표한 논문인데, 재밌는 approach 를 하고 있어서 가져와 봤습니다. ELECTRA paper : OpenReview google ai blog : blog Related Work 이전 trend 들 5 개 정도만… BERT : paper XLNET : paper RoBERTa : paper ALBERT :...


  • Self-training with Noisy Student improves ImageNet classification

    posted by kozistr tl;dr 이번 포스팅에서 리뷰할 논문은 EfficientNet 기반으로 새로운 techniques 를 적용해서 ImageNet dataset 에서 SOTA 를 찍은 논문입니다. 나온지는 꽤 됐지만, 최근 TPU 에서 돌아가는 요 코드를 짜다가 생각나서 리뷰하게 됐어요. 아래는 이번 approach 가 달성한 성능인데, 이전 SOTA 에 비해서 Accuracy 가 약 2% 정도 올라갔네요....