파이썬3.12, 쿠다128기준으로5090 작동 버전 조건Triton >= 3.3, PyTorch >= 2.7, and CUDA >= 12.8 torch 2.7.1 + xformers0.0.31'pip install torch==2.7.1 torchvision==0.22.1 torchaudio==2.7.1 xformers==0.0.31 --index-url https://download.pytorch.org/whl/cu128 --force-reinstall' 이후 업데이트되더라도 아래에서 버전별 방법보면됨https://pytorch.org/get-started/previous-versions/xformers는 현재 torch2.7.1까지만 지원하므로 torch2.8대신 2.7.1깜xformers의 버전정보..
1탄 - comfyui 디테일러 남자얼굴 제외하기 #1첫번째 방법을 테스트해보고 잘 작동한다면 그대로 써도 된다문제는 디텍터라는 것이 하나만 사용했을때 신뢰성이 높지 않다는 것이다.특히나 애니의 경우 그림체가 천차만별이기에 남녀구분의 난이도가 높다포켓몬에서 남녀를 잘 구분하던 모델이라도 죠죠나 마음의소리 같은거로넘어가면 ai입장에서 쉽지 않은것이다.뭐 그정도 극단적이지 않더라도 그냥 나루토->원피스 이렇게만되도 작동오류가 나는 경우가 많다. 이렇게 오류가 나는 근본적 원인은판단근거가 애매하고 복잡하기 때문이다. 그렇기에 발상을 바꿔서 단순하게 갈 필요가 있다.컴퓨터가 십진수를 안쓰고 0과 1의 이진수, 디지털이 된 이유는3이라는 애매한 숫자보다 있다,없다를 명확하게 나타내는게확실하게 오류가 줄어들기 때문..
디테일러는 원하는 부위를 디텍팅한후 확대->인페인트->축소를 하는 역할을 한다. 뭉개진 얼굴을 인간답게 만드는 반필수요소지만문제는 여캐에 올인하는 우리들로썬 같이 있는 아저씨 얼굴도 강남미인으로만들어주는 무시무시한 능력을 바라지 않는다는 것이다그래서 여캐만 찾아내는 디텍팅모델을 원하지만 애니케릭은 좀 쉽지가 않다남캐여캐 기준이 진짜 모호한 경우도 문제지만 흑,백,황 인종만 처리하면 되는 실사와 달리애니케릭은 퍼리부터 파리까지 별개떡같은 케릭과 온갖 그림체가 다 있어서훈련자체가 까다롭고 결정적으로 대기업님은 2d에 투자하지 않는다결국 우리스스로가 모델을 훈련시키는게 베스트지만 Ai러로써 기본자세는나무늘보나 팬더 같은거기에 스스로 뭔가를 한다는 것은 절대 쉽지 않다 그래서 있는걸 어떻게 주섬주섬해서 만드는 ..
# FIREFLY의 유용성포토샵의 AI생성은 일반 그림수정에서 유용하겠지만AI그림쪽에선 현재 대체가능한 툴이 없는 초강력 툴이다이유는 AI생성 그림은 일반그림과 달리 어딘가가 나사가 빠진 경우가 많다그중 젤 문제가 손이다지금이야 비약적으로 발전했지만 예전의 경우 손가락이 단 한장도 제대로 나오는 경우가 없을 정도였다이 그림이 2년전(23년)에 생성했던 그림이다. 딱 봐도 양손가락이 미쳐돌아가는걸 볼 수 있다이럴때 방법은 3가지다. 조금 프롬을 바꿔서 다시 생성하거나, 인페인트로 부분재생성하거나포토샵으로 직접 수정하는 것이다앞서 두가지 방법이 사실 더 정확하지만 문제는 시간과 세팅의 번거로움이 꽤 크다는 것이다반면 포토샵의 AI는 매우 간단하다선택툴로 선택한후생성을 돌리면 여러번의 가챠(뽑기)는 필요하지만..
Lora파일은 로딩하는 순간 모델에 포함이 되지만그것을 불러올때 트리거워드가 필요한 경우가 대부분이다.쉽게 말해 고양이를 'cat'으로 학습한 모델에서 고양이를 등장시키고 싶을때그 모델이 고양이만 있는 모델이면 지시어 없이 돌려도 고양이가 높은 확률로 나오겠지만여러가지 학습자료(사람,개)들이 포함되어있을때 트리거없이 뽑으면 랜덤으로 나온다그래서 'cat'이라는 학습당시 인지시킨 트리거를 적어줘야한다 일반적인 모델의 경우 그러한 트리거들이 대중적인 단어들이지만로라의 경우 특수목적이기 때문에 트리거가 'ss1cat' 이런 것일 수가 있다이유는 기존 모델이 학습한 단어를 덮어쓰지 않게 유니크한 것을 설정하기 때문이다그말은 로라정보없이 로라만 딸랑 받은상태에서는 해당로라의 링크라던지 정보를 잃어버리면발동 키워드..
위의 원본 그림을 wan을 돌려서 보았다그렇게 해서 나온게 아래의 영상(840x480) 이제 이걸 upscale(업스케일) 하고 interpolate(프레임보간)을 해보자 1696x960 해상도에 60프레임이 되었다. 눈에 띄게 화질이 좋아지고 프레임이 부드러워진 것을 알수 있다즉, 영상을 만들고 업스랑 프레임보간은 상당히 매력적인 선택이라고 할 수 있다하지만 여기엔 큰 문제가 있는데 이 추가 작업을 해주는데만 7분40초가 걸렸다는 것이다오히려 영상을 만드는 시간(5분)보다 더 오래 걸려서 총 12분40초정도의 시간이 걸렸다.게다가 5090이 나온이상 내 그래픽 사양인 4090은 하이엔드라고 할 수는 없지만매우 근접한 아랫단계 카드인 점을 고려하면 그 아래급 카드들은 두배에 가깝게 걸..