Google이 App Store 스팸을 찾는 방법
게시 됨: 2017-11-01
Google은 Play 스토어에서 사용 가능한 애플리케이션 중 앱 스토어 스팸을 찾고 있습니다.
특허 출원 앱 스토어 스팸 찾기
검색과 웹과 관련된 특허를 보는 것을 좋아합니다. 검색 엔진이 해결하려고 하는 문제를 설명하기 때문입니다. 이러한 특허는 이러한 문제를 해결하기 위한 솔루션으로 의도된 발명을 보여줍니다. 때때로 그들은 다른 회사가 유사한 문제를 해결하는 방법을 연구함으로써 누군가가 자신의 문제를 해결하는 방법을 배울 수 있는 방법을 보여줍니다.
이번 달에는 앱 스토어 스팸을 찾는 Google 특허가 부여되었습니다. Google은 Android 운영 체제를 개발하고 실행하면서 Android 기기에서 실행되는 앱을 위한 시장을 개발했습니다. Apple의 경쟁자로서 Apple로부터 배울 점이 많습니다. Google Patent에는 특허 출원인이 인용한 글에 영향을 줄 수 있는 몇 가지 기사가 언급되어 있습니다. 그것들을 읽는 것은 특허에 대한 좋은 소개입니다.
흥미롭게도 이러한 기사는 Google에서 운영하는 것이 아니라 Apple App Store에 초점을 맞추고 있습니다. Google이 Apple App Store가 자체 App Store를 운영하는 데 도움이 되었을 수 있는 문제도 살펴보는 것이 합리적입니다.
이 기사의 첫 번째 기사는 iOS 앱 스토어에서 스팸 식별하기입니다.
이 백서의 요약은 Apple App Store를 스팸하는 사람들과 관련된 앱 및 문제에 대해 알려줍니다.
Apple iOS App Store의 인기 앱은 수백만 달러의 수익을 창출하고 귀중한 개인 사용자 정보를 수집할 수 있습니다. 사기성 리뷰는 잠재적으로 유해한 스팸 앱을 다운로드하도록 사용자를 속이거나 리뷰 스팸의 피해자인 앱을 부당하게 무시할 수 있습니다. 따라서 App Store에서 자동으로 스팸을 식별하는 것은 중요한 문제입니다. 이 문서는 iOS 앱 스토어 크롤링을 통해 얻은 새로운 데이터 세트를 소개 및 특성화하고, 앱 스팸 분류를 위한 기본 의사 결정 트리 모델과 새로운 잠재 클래스 그래픽 모델을 비교하고, 클러스터링 리뷰를 위한 예비 결과를 분석하는 것을 목표로 합니다.
백서 소개에서 스팸 앱의 문제에 대해 자세히 설명합니다.
스팸 앱 개발자(악의적인 개발자)는 주로 금전적 이익을 얻거나 주소록 연락처와 같은 귀중한 사용자 데이터를 유출하는 데 관심이 있습니다. 합법적인 것처럼 보이는 인기 있는 앱은 사용자 데이터를 조용히 유출할 수 있으므로[2, 4] 스팸 앱이 동일한 작업을 시도할 가능성이 있습니다.
다른 사람들이 경험한 문제를 살펴보면 많은 것을 배울 수 있습니다.
악의적인 개발자는 "sockpuppets"와 같은 일회용 iTunes 사용자 계정을 사용하여 스팸 리뷰를 게시할 수 있습니다. Apple은 사용자가 앱을 검토하기 전에 구매 및 다운로드하도록 하여 스팸 빈도를 줄이려고 했습니다. 그러나 sockpuppet 사용자 계정은 여전히 iTunes 기프트 카드를 사용하여 생성할 수 있으며 잠재적인 이익 및 도난당한 사용자 데이터로 인해 비용이 정당화될 수 있습니다.
이 문서에서는 스팸을 식별하기 위해 노력했다고 알려줍니다. 그들은 App Store의 스팸 행위와 관련된 리뷰 패턴을 살펴봄으로써 이를 수행합니다.
다른 문서에서는 Apple이 스팸 행위를 식별하기 위해 시도한 몇 가지 다른 작업에 대해 설명합니다.
Apple이 앱 스토어 순위 알고리즘을 수정하여 다운로드의 중요성을 줄였을 수 있음
흥미롭게도 이 백서는 Android 스토어의 앱에 대해서도 설명합니다.
Android 마켓 순위를 지속적으로 조정하는 Google은 10대에 초점을 맞춘 소셜 네트워크 MyYearbook에 따르면 최근 몇 주 동안 앱의 일일 활성 사용자 대 월간 활성 사용자 비율(고정성의 척도)을 더 무겁게 평가하기 시작했을 수 있습니다. 회사는 전체 앱 포트폴리오에서 의심스러운 순위 변동을 발견했습니다. 구글은 이에 대해 언급하지 않았다.
한때 Apple Store에서 다운로드가 매우 중요했습니다. 이것은 중요한 변경 사항입니다.
Apple 앱 스토어 순위는 현재까지 앱의 다운로드 비율에 크게 의존해야 했기 때문에 이러한 변경은 큰 문제입니다. 이것은 전체 가내 산업이 번성하도록 허용했습니다. Flurry, Tapjoy 및 W3i와 같은 네트워크를 통해 개발자는 다운로드 비용을 지불할 수 있으며, 이는 추가 가시성을 통해 더 많은 다운로드를 얻을 수 있는 차트 상단에 앱을 올립니다. 그것들이 좋다면, 그들은 차트의 상단에 고정됩니다. 나쁘면 빨리 넘어집니다.
Google 특허는 다음과 같습니다.
애플리케이션 스토어 순위 스팸 탐지
발명가: Kaihua Zhu 및 Ping Wu
양수인: GOOGLE INC.
미국 특허: 9,794,106
부여: 2017년 10월 17일
출원일: 2013년 3월 4일
추상적 인
사용자에 대한 컨텐츠의 배포를 관리하도록 구성될 수 있는 서버는 특정 사용자와 관련된 컨텐츠 관련 정보를 수신하고 컨텐츠 관련 정보를 분석할 수 있다. 이러한 분석은 수용 가능한 콘텐츠 관련 활동을 결정하고 콘텐츠 관련 정보의 분석에 기초하여 사용자를 분류하기 위해 콘텐츠 관련 정보의 매개변수를 서버의 대응하는 미리 정의된 매개변수와 비교하는 것을 포함할 수 있습니다. 콘텐츠 관련 정보는 콘텐츠 사용 관련 데이터, 콘텐츠 다운로드 관련 메트릭, 또는 서버를 통해 관리되는 콘텐츠의 사용과 함께 사용자에 의해 활용되는 하나 이상의 세션과 관련된 사용자 세션 관련 메트릭 중 하나 이상을 포함할 수 있습니다.
이 특허를 읽기 전에 먼저 해당 기사를 읽는 것이 도움이 됩니다. 그들은 무엇이 위험에 처했는지, 무엇이 변경되었는지, 그리고 왜 특허가 특허가 하는 일에 초점을 맞추는지에 대한 감각을 제공합니다.
콘텐츠 사용 관련 데이터는 다음과 같이 구성되는 중요한 지표라고 합니다.
- 사용자가 콘텐츠를 사용하는 동안 전자 장치에서 생성되는 데이터,
- 특정 콘텐츠의 구매 또는 업데이트 횟수와 관련된 시장 데이터,
- 콘텐츠 사용 활동에 대한 제3자 데이터.
이 특허는 다음과 같은 항목을 포함하는 다운로드 관련 측정항목에 대해 알려줍니다.
- 사용자가 다운로드한 모든 콘텐츠에서 특정 유형의 콘텐츠 비율
- 하루 최대 다운로드 콘텐츠 수
- 다운로드한 총 콘텐츠 수
- 한 주에 다운로드할 수 있는 최대 콘텐츠 수
스토어에서 볼 수 있는 또 다른 사항은 앱을 찾는 사람들이 앱 스토어에서 행동하는 방식입니다.
사용자 세션 관련 측정항목에는 다음이 포함될 수 있습니다.
- 사용자가 검색하여 다운로드한 콘텐츠의 비율
- 사용자가 발행한 여러 쿼리
- 탐색 및/또는 클릭을 통해 다운로드된 콘텐츠 비율
- 평균 세션 시간 및/또는 검색에서 다운로드까지의 지연
- 직접 인바운드 트래픽에서 다운로드한 콘텐츠의 비율입니다.
App Store 스팸을 찾기 위한 애플리케이션 사용량 기반 측정항목
사람들이 앱 스토어에서 어떻게 행동하는지 살펴보는 것 외에도 앱을 실행하는 기기는 앱을 설치한 사람들이 해당 앱을 사용하는 방식에 대한 데이터를 수집할 수 있습니다.
특허에 대한 설명에서 이러한 접근 방식의 이면에 있는 동기와 작동 방식에 대한 세부 정보를 제공합니다.
예를 들어, 애플리케이션 사용 기반 순위 지정 및/또는 스팸 탐지를 통해 애플리케이션은 총 다운로드 수 대신 사용 기반으로 순위가 매겨질 수 있습니다. 이와 관련하여 사용은 다운로드보다 생성하는 데 훨씬 더 비쌀 수 있으며, 따라서 애플리케이션 다운로드 스팸을 생성하는 비용을 지속하기에는 너무 비싸게 만듭니다. 따라서, 클라이언트 장치는 사용 관련 메트릭을 수집 및/또는 획득할 수 있습니다. 사용 관련 메트릭의 예는 운영 체제(OS) 관련 메트릭 및/또는 특정 애플리케이션이 여러 번 시작되고 사용자가 이를 사용하는 시간과 같은 기타 API 관련 정보를 포함할 수 있습니다. 애플리케이션이 업데이트되는 횟수 및 애플리케이션 내 구매 횟수(애플리케이션 시장이 지불을 처리할 때)와 같은 시장 메트릭; 및 제3자 데이터. 이와 관련하여, 전문화된 제3자 애플리케이션 엔티티는 수억 개의 장치에 걸쳐 수십만 애플리케이션 사용의 애플리케이션 사용을 수집 및/또는 획득하고/하거나 해당 데이터를 제공할 수 있습니다. 애플리케이션 관리 서버는 초기에 사용 관련 메트릭의 신뢰성을 결정할 수 있습니다. 신뢰할 수 있는 것으로 결정되면 애플리케이션 관리 서버는 모든 다른 사용 관련 정보를 결합 및/또는 분석할 수 있으며, 이를 통해 일반 사용자가 특정 애플리케이션을 사용하는 방법(예: 애플리케이션을 사용하는 시간)을 보다 최적으로 결정할 수 있으므로 애플리케이션 관리 서버는 그에 따라 응용 프로그램의 순위를 매길 수 있습니다(또는 기존 순위를 조정할 수 있음). 또한, 애플리케이션 관리 서버는 사용자 분류에 관한 결정에 순위 및/또는 순위 조정을 사용할 수 있습니다.
결론: 이상 식별
이 특허는 또한 상호 작용을 다운로드하는 방법에 대한 세부 정보를 제공하며 사용자 세션 데이터를 사용하여 스팸 발송자를 식별할 수 있습니다. 이러한 세부 정보는 합법적이지 않을 수 있는 앱을 결정하는 데도 도움이 됩니다. 다음은 앱을 선택하고 다운로드할 때 검토될 수 있는 사용자 데이터의 종류입니다.
애플리케이션 관리 서버는 예를 들어 시장 검색 상자를 통해 이루어진 사용자 검색어와 관련된 데이터를 획득, 수집 또는 수신할 수 있으며;
마켓 페이지에서 클릭한 링크
시장 페이지 사용자 조회수;
각 페이지에서 보낸 시간;
및/또는 다운로드 이벤트 응용 프로그램 사용자(구매)가 다운로드, 설치되었습니다.
이 특허는 사용자가 검색 단계를 거쳐 애플리케이션을 찾을 때도 정보가 수집되며 비정상적인 활동을 주의 깊게 관찰한다고 알려줍니다.
다운로드된 각각의 애플리케이션에 대해, 애플리케이션 관리 서버는 애플리케이션이 다운로드된 이유를 식별할 수 있고 그 다운로드에 대응하는 사용자 세션 관련 메트릭 세트를 생성할 수 있다. 그런 다음 애플리케이션 데이터 분석기는 비정상을 식별하기 위해 전체 사용자 모집단에 대한 백분율을 결정할 수 있습니다. 세션 메트릭의 예는 특정 세션 동안 사용자가 발행한 여러 쿼리(및/또는 특정 기간의 총 쿼리(예: 하루))와 같은 것들과 관련될 수 있습니다. 검색에서 다운로드한 애플리케이션의 비율; 브라우징 및 클릭률에서 다운로드한 애플리케이션 비율; 직접 인바운드 트래픽에서 다운로드된 애플리케이션 비율; 평균 세션 시간; 및/또는 검색에서 다운로드까지의 지연. 따라서, 전체 사용자 모집단에 대한 사용자 세션 관련 메트릭을 얻는 것은 적용 가능한 예상 세션 관련 기준(예를 들어, 임계값(들))을 결정하는 것을 허용할 수 있으며, 이는 세션 메트릭이 어디에 해당하는지 결정하는 데 사용됩니다(예: 비교). 특정 사용자의 애플리케이션(들)이 떨어지며(즉, 전체 사용자 모집단과 비교하여), 따라서 사용자의 분류를 허용합니다.
사람들이 App Store에서 행동하는 방식과 관련된 비정상적인 행동은 사람들이 사용하거나 다운로드하고 싶어하는 앱이 아닐 수 있는 앱을 지적하는 데 도움이 될 수 있습니다. 작년에 Google과 Apple 모두 매우 인기 있는 Pokemon Game으로 성공을 거둔 것을 보았습니다. 사람들에게 인기 있는 앱을 제공하는 것은 App Store 스팸과 싸우기 위한 노력의 가치가 있습니다.

