카스 1.6 다운로드

경쟁 적인 관심사: 저자는 경쟁 적인 이익이 존재하지 않는다고 선언했습니다. 마지막으로 모든 알고리즘의 메모리 사용량을 계산했습니다. 그림 7은 각 데이터 집합을 분석하는 데 필요한 총 메모리 사용량을 나타내고 그림 8은 컴퓨터당 평균 메모리 사용량을 보여 주며, 그림 8은 컴퓨터당 평균 메모리 사용량을 보여줍니다. 두 수치 모두 x축은 데이터 집합을 나타내고 y축은 메모리 사용량을 나타냅니다. 도 7에 도시된 바와 같이, MCL, k-center 및 PSCAN은 제안된 알고리즘에 사용되는 메모리의 2배 이상을 필요로 했다. 그림 8과 같이 CASS의 총 메모리 사용량은 SCAN++보다 약간 더 많지만 한 대의 컴퓨터에 대한 CASS의 메모리 사용량은 SCAN++에 비해 적습니다. CASS는 분산 시스템 환경에서 개발되었기 때문에 총 메모리 사용량은 총 컴퓨터 수로 나뉩니다. 저작권: © 2018 Kim 외. 이 문서는 크리에이티브 커먼즈 저작자 표시 라이선스 의 조건에 따라 배포되는 공개 액세스 문서로, 원본 저자와 출처가 적립된 경우 모든 매체에서 무제한 사용, 배포 및 복제를 허용합니다. 네트워크 크기가 증가함에 따라 대규모 네트워크 데이터를 분석하는 것이 중요해지고 있습니다. 네트워크 클러스터링 알고리즘은 네트워크 데이터 분석에 유용합니다. 병렬 기계 환경이 아닌 단일 기계 환경에서 기존의 네트워크 클러스터링 알고리즘이 활발히 연구되고 있습니다. 그러나 이러한 알고리즘은 메모리 크기 문제로 인해 대규모 네트워크 데이터를 분석할 수 없습니다.

솔루션으로, 우리는 아파치 스파크 환경에서 효율성을 향상시키기 위해 기존의 클러스터링 알고리즘의 패러다임을 변경하여 아파치 스파크를 사용하여 대규모 네트워크 데이터 분석을위한 네트워크 클러스터링 알고리즘을 제안한다. 또한 Bloom 필터 및 셔플 선택과 같은 최적화 방법을 적용하여 메모리 사용량과 실행 시간을 줄입니다. 평균 정규화 컷을 기반으로 제안된 알고리즘을 평가함으로써 알고리즘이 생물학적, 공동 저작자, 인터넷 토폴로지 및 소셜 네트워크와 같은 다양한 대규모 네트워크 데이터 세트를 분석할 수 있음을 확인했습니다. 실험 결과에 따르면 제안된 알고리즘은 메모리 사용량이 적은 비교 알고리즘보다 더 정확한 클러스터를 개발할 수 있습니다. 또한 제안된 최적화 접근 방식과 제안된 알고리즘의 확장성을 확인합니다. 또한 제안된 알고리즘에서 발견된 클러스터가 생물학적으로 의미 있는 함수를 나타낼 수 있는지 확인합니다.

Kommentare sind geschlossen.